当前位置: 首页 > news >正文

网站建设公司简介模板下载/郑州seo优化外包顾问

网站建设公司简介模板下载,郑州seo优化外包顾问,最大的域名注册网站是那个,网页设计与制作hbuilder如何审查网页元素 对于一个优秀的爬虫工程师而言,要善于发现网页元素的规律,并且能从中提炼出有效的信息。因此,在动手编写爬虫程序前,必须要对网页元素进行审查。本节将讲解如何使用“浏览器”审查网页元素。 浏览器都自带检查…

如何审查网页元素

对于一个优秀的爬虫工程师而言,要善于发现网页元素的规律,并且能从中提炼出有效的信息。因此,在动手编写爬虫程序前,必须要对网页元素进行审查。本节将讲解如何使用“浏览器”审查网页元素。

浏览器都自带检查元素的功能,不同的浏览器对该功能的叫法不同, 谷歌(Chrome)浏览器称为“检查”,而 Firefox 则称“查看元素”,尽管如此,但它们的功却是相同的,本教程推荐使用谷歌浏览器。

检查百度首页

下面以检查百度首页为例:首先使用 Chrome 浏览器打开百度,然后在百度首页的空白处点击鼠标右键(或者按快捷键:F12),在出现的会话框中点击“检查”,并进行如图所示操作:

python爬虫审查元素

图1:检查百度首页元素(点击看高清图)

点击审查元素按钮,然后将鼠标移动至您想检查的位置,比如百度的输入框,然后单击,此时就会将该位置的代码段显示出来(如图 1 所示)。最后在该代码段处点击右键,在出现的会话框中选择 Copy 选项卡,并在二级会话框内选择“Copy element”,如下所示:

python爬虫网页元素审查

图2:Copy代码段

百度输入框的代码如下所示:

<input type="text" class="s_ipt" name="wd" id="kw" maxlength="100" autocomplete="off">

依照上述方法,您可以检查页面内的所有元素。

编辑网页代码

通过检查元素也可以更改网页代码,下面通过C语言中文网登录界面进行简单演示:

python爬虫检查网页元素

图2:检查网页元素(点击看高清图)

检查密码框的 HTML 代码,代码如下所示:

<input name="password" type="password" id="password" autocomplete="off">

只要在显示出的代码段上稍微做一下更改,密码就会变为可见状态。如下图所示:

python爬虫编辑网页代码

图3:检查网页元素(点击看高清图)

双击 type=“password” 将输入框类型更改为 text,此类操作适用于所有网站的登录界面。但是需要注意,您做的更改仅限本次有效,当关闭网页后,会自动恢复为原来的状态。

检查网页结构

对于爬虫而言,检查网页结构是最为关键的一步,需要对网页进行分析,并找出信息元素的相似性。下面以猫眼电影网为例,检查每部影片的 HTML 元素结构。如下所示:

python爬虫检查网页结构

图4:检查网页结构(点击看高清图)

第一部影片的代码段如下所示:

  <div class="board-item-main"><div class="board-item-content"><div class="movie-item-info"><p class="name"><a href="/films/1299372" title="你好,李焕英" data-act="boarditem-click" data-val="{movieId:1299372}">你好,李焕英</a></p><p class="star">主演:贾玲,张小斐,沈腾</p>
<p class="releasetime">上映时间:2021-02-12</p>    </div><div class="movie-item-number score-num">
<p class="score"><i class="integer">9.</i><i class="fraction">5</i></p>       </div></div></div>

接下来检查第二部影片的代码,如下所示:

  <div class="board-item-main"><div class="board-item-content"><div class="movie-item-info"><p class="name"><a href="/films/553231" title="心灵奇旅" data-act="boarditem-click" data-val="{movieId:553231}">心灵奇旅</a></p><p class="star">主演:杰米·福克斯,蒂娜·菲,菲利西亚·拉斯海德</p>
<p class="releasetime">上映时间:2020-12-25</p>    </div><div class="movie-item-number score-num">
<p class="score"><i class="integer">9.</i><i class="fraction">3</i></p>       </div></div></div>

经过对比发现,除了每部影片的信息不同之外,它们的 HTML 结构是相同的,比如每部影片都使用

标签包裹起来。这里我们只检查了两部影片,在实际编写时,你可以多检查几部,从而确定它们的 HTML 结构是相同的。

提示:通过检查网页结构,然后发现规律,这是编写爬虫程序最为重要的一步。

http://www.lbrq.cn/news/803683.html

相关文章:

  • 企业营销型网站有特点/一站式网站建设公司
  • 建手机网站怎么收费/2345网址导航电脑版官网
  • 一个网站的建设流程有哪些资料/7月新闻大事件30条
  • 天津外贸网站建设/谷歌优化方法
  • 网站锚文本怎么做/今日头条国际军事新闻
  • 一般通过人体的电流超过多大/seo优化排名是什么
  • 凡科的网站做seo比较难/百度搜索指数排行
  • 南京高端网站建设公司哪家好/建设网站制作公司
  • 哪里做网站做的好/企业推广方式有哪些
  • 个人网站怎么做联盟推广/广州seo快速排名
  • 十大电商代运营服务商/windows优化软件
  • 武汉网页设计公司/seo是什么的
  • 公司建设网站算入什么会计科目/重庆今日头条新闻消息
  • 制作网站建设的公司/云搜索
  • wordpress 留言板插件/公众号seo排名
  • wordpress仿站模板制作教程/南京seo公司
  • 网站运营设计/优秀营销软文范例100字
  • wordpress orchidv 插件/seo与sem的区别与联系
  • 领星erp系统/seo搜索排名优化是什么意思
  • wordpress 调用浏览数/四川seo推广
  • 百姓网招聘/seo对网店推广的作用有哪些
  • vs2012网站开发课程设计/seo的培训班
  • 厦门外贸企业网站建设/代做百度首页排名
  • 做方案还找不到素材 这里有最全的设计网站/下载百度app免费下载安装
  • 银川市网站建设/企业网站设计与实现论文
  • 四川建设网网站/企业网站优化关键词
  • 网站怎么做不违法/上海seo推广
  • 屏蔽某网站怎么做/怎么做业务推广技巧
  • 超市代理商网站模板/百度一下百度官方网
  • 襄阳网站建设公司哪家好/国外seo
  • 高性能MCP服务器架构设计:并发、缓存与监控
  • 学习游戏制作记录(各种水晶能力以及多晶体)8.1
  • 【MySQL索引失效场景】索引失效原因及最左前缀原则详解
  • C++对象访问有访问权限是不是在ide里有效
  • 在SQL SERVER 中,用SSMS 实现存储过程的每日自动调用
  • 南太平洋金融基建革命:斐济-巴新交易所联盟的技术破局之路 ——从关税动荡到离岸红利,跨境科技如何重塑太平洋资本生态