当前位置: 首页 > news >正文

mediwiki 做网站东莞网站建设做网站

mediwiki 做网站,东莞网站建设做网站,毕设做网站心得体验,518机械加工网0.前言 你是从什么时候开始接触网络的呢?十年前的人们大多数是从PC和网吧开始的,如今的人们几乎都是从手机和WiFi开始的。浏览器、社交软件和购物软件等已经成为绝大数人的标准配置。 2017年,互联网之父伯纳斯李因“发明万维网、第一个浏览器…

0.前言

  你是从什么时候开始接触网络的呢?十年前的人们大多数是从PC和网吧开始的,如今的人们几乎都是从手机和WiFi开始的。浏览器、社交软件和购物软件等已经成为绝大数人的标准配置。

  2017年,互联网之父伯纳斯·李因“发明万维网、第一个浏览器和使万维网得以扩展的基本协议和算法”而获得2016年度的图灵奖。网络改变了人们的生活,成为我们不可或缺的一部分。

  本篇将从浏览器开始,以HTTP为例子,通过WireShark软件介绍网络协议和数据传输,为后面博客要介绍的网络爬虫做铺垫。

1.浏览器那些事

  最流行的网络浏览器是Google Chrome,Microsoft Edge(之前是Internet Explorer,简称IE浏览器), Safari,Opera和Firefox。浏览器最重要的浏览器内核,又称为浏览器引擎,比如IE浏览器的内核Trident,火狐的内核Gecko,以及已经废弃的Opera内核Presto,然后就是一大堆WebKit内核的变体。WebKit开源算是苹果做的一件好事,另一个是Clang/LLVM。

  WebKit产生了很多分支,除了具体的浏览器外,一些支持RIA的语言和框架也提供了WebKit的封装,C++有QtWebKit以及谷歌的CEF框架、Java中JavaFX的WebView。谷歌在WebKit的基础上,弄出了Blink内核,还自己做了一个JavaScript引擎V8。然后,在V8的基础上产生了Node.js,极大的改善了JavaScript的开发生态圈。

  此外,HTML5技术和WebGL技术的引入丰富了浏览器在多媒体和3D渲染方面的功能,加速了落后技术如Flash的淘汰过程。

2.网络协议那些事

  网络协议为计算机网络中进行数据交换而建立的规则、标准或约定的集合。一般的说法是,OSI七层与TCP/IP五层,而TCP/IP承担当今互联网上的绝大部分数据传输任务。

  关于网络协议的第一手资料来源IETF组织制作的一系列标准文档,又称为RFC文档。实际上的网络标准非常的多,如今RFC系列文档已经达到了八千多份。这些文档可以在IETF官网进行下载。

  如果官网的网速较慢,可以在香港中文大学的ftp站点上下载,http://ftp.cuhk.edu.hk/pub/doc/ripe/rfc/。

  最常见的协议是HTTP协议,其基础是TCP/IP协议。HTTP的知识点可以先看一下Runoob的介绍。

  首先,我们看一下浏览器通过HTTP下载HTML文件的过程,以火狐打开百度主页为例:

  打开百度主页,按F12,选择网络选项,点击右侧"显示请求细节"按钮,如图所示:

  

  可以看到HTTP的请求头和响应头。上图显示的界面又称为Web Console,几乎所有的浏览器按F12都会出来,在javascript的ide出现以前,这就是前端开发者调试javascript代码最常用的工具。

3.WireShark那些事

  Wireshark(前称Ethereal)是一个网络封包分析软件。网络封包分析软件的功能是撷取网络封包,并尽可能显示出最为详细的网络封包资料。Wireshark使用WinPCAP作为接口,直接与网卡进行数据报文交换。

  与网络协议打交道,经常要做的事情就是抓包,而最常用的抓包工具就是WireShark。Linux下常用的抓包工具是tcpdump,当然,如果是图形化的Linux也可以使用WireShark以及其命令行工具。

  下载安装好WireShark后,选择对于的网卡,以HTTP协议进行过滤,进入bing主页,可以看到:

  

  可以看到HTTP的内容,也可以看到TCP和IP的内容。但是浏览器的请求往往或产生很多条HTTP记录,不容易看清楚。用curl和wget之类的命令行工具会比较清晰。

  比如用curl获去百度主页的内容: curl www.baidu.com

  

  不过内容不是我们想要的,与浏览器不一致,原因是百度的服务器检测到了User-Agent字段。

  

  先使用 curl -v www.baidu.com 查看请求头,代理为curl/7.53.1:

$ curl -v www.baidu.com
* STATE: INIT => CONNECT handle 0x20048360; line 1418 (connection #-5000)
* Rebuilt URL to: www.baidu.com/
* Added connection 0. The cache now contains 1 members
*   Trying 119.75.217.109...
* TCP_NODELAY set
* STATE: CONNECT => WAITCONNECT handle 0x20048360; line 1471 (connection #0)
* Connected to www.baidu.com (119.75.217.109) port 80 (#0)
* STATE: WAITCONNECT => SENDPROTOCONNECT handle 0x20048360; line 1588 (connection #0)
* Marked for [keep alive]: HTTP default
* STATE: SENDPROTOCONNECT => DO handle 0x20048360; line 1606 (connection #0)
> GET / HTTP/1.1
> Host: www.baidu.com
> User-Agent: curl/7.53.1
> Accept: */*

  我们可以将User-Agent置为空,再请求一次: curl --user-agent "" www.baidu.com ,这一次得到了一致的内容。

    另外,wget查看请求头和响应头: wget --debug --spider www.baidu.com ,加入user-agent信息: wget -U www.baidu.com

  未完,待续。。。

转载于:https://www.cnblogs.com/wurui1994/p/6735780.html

http://www.lbrq.cn/news/2416609.html

相关文章:

  • 五台网站建设攀枝花网站seo
  • 小程序解析wordpressseo电商运营是什么意思
  • 现在企业做网站用什么软件培训心得体会2000字
  • 邢台做网站的价格免费建网站平台
  • 商城网站模块北京seo百度推广
  • 动态网站设计用什么软件杭州seo整站优化
  • 源码上传网站魔贝课凡seo课程好吗
  • 网站如何做留言板南宁seo收费
  • 怎么做网站推广的论文离我最近的电脑培训中心
  • 建设银行网站是什么应用商店app下载
  • 安徽省建设厅执业资格注册中心网站百度浏览器网址
  • 商城小程序多少钱seo关键词优化推广报价表
  • 孝感网站建设公司推广平台网站有哪些
  • 校友网站 建设做网络推广有前途吗
  • 做分类信息网站模板能搜任何网站的浏览器
  • 茂易网站建设seo专员是指什么意思
  • 网站的做网站的公司台州网站优化公司
  • 品牌网站建设报价青岛网络工程优化
  • 做文章网站外贸网站建站
  • 网站品牌建设建议软件推广平台有哪些
  • 广州番禺专业做网站网络营销教材电子版
  • 网站建设分金手指排名一软文推广广告
  • 网站如何做服务器授权书搜索关键词查询工具
  • 独立系统网站360关键词推广
  • 用ps怎么做网站导航条论述搜索引擎优化的具体措施
  • 购物商城网站模板淘宝如何刷关键词增加权重
  • soho外贸网站建设重大军事新闻最新消息
  • 网站服务器开发长沙网站优化效果
  • iis7.5 网站打不开营销培训课程有哪些
  • 廊坊web成都seo论坛
  • 有关Mysql数据库的总结
  • Softhub软件下载站实战开发(十九):软件信息展示
  • 【Lua】多脚本引用
  • kotlin Flow快速学习2025
  • 《命令行参数与环境变量:从使用到原理的全方位解析》
  • 【2025/07/19】GitHub 今日热门项目