当前位置: 首页 > news >正文

java程序员做自己的网站手机怎么制作网页

java程序员做自己的网站,手机怎么制作网页,政府网站欣赏,太原做网站的鸣蝉公司python爬去网页数据时,如果使用requests库和xpath,首先需要使用lxml的etree将获取的网页数据完整,因为有时候使用requests.get(url ,headersheaders)获取到的数据不完整。etree模块就可以自动修复html文本。安装lxml:lxml是python的一个解析库…

python爬去网页数据时,如果使用requests库和xpath,首先需要使用lxml的etree将获取的网页数据完整,因为有时候使用requests.get(url ,headers=headers)获取到的数据不完整。etree模块就可以自动修复html文本。

安装lxml:

lxml是python的一个解析库,支持html和xml的解析,同时也支持xpath解析方式。

pip install lxml

etree模块的使用

from lxml import etree

对网页HTML的解析,使用etree.HTML(html.content)

接下来就可以使用xpath抓取对应的需求节点的信息了。

xpath的语法

选取节点:

/: 表示选取直接子节点

xpath: /div

result: null

season: /div表示获取根节点下的div但是,根节点下只有 这一个子节点,/是不能获取到子孙节点的

//: 表示获取任意节点

谓语:

通过列子来说明

//book/div[1]

explanation: 获取book节点下的第一个div节点

注意: xpath语法的下标是从数字1开始的,这里和python的语法是有区别的

//book/div[last()]

explanation: 获取book节点的最后一个div节点

//book/div[positon()<3]

explanation: 获取book节点下的前两个div节点

//book/div[@price=1]

explanation: 获取book节点下属性price=1 的div节点

//book/div[contains(@class,"f")]

explanation: 获取book节点下class属性中包含f的div节点

通配符:

: 表示获取任意的节点

@:表示任意属性

多个路径:

| : //book[@price=1] | //book[@price=2] 表示获取属性price=1或者price=2的book节点

逻辑运算符:

< ,> , <= ,>= , !=, and , or

http://www.lbrq.cn/news/2625463.html

相关文章:

  • 上海金山网站建设公司网络营销的含义
  • 广德做网站网站的优化公司
  • 网站建设 环保素材青岛关键词排名提升
  • 网站创建方案论文百度站长工具怎么用
  • 专题网站建设的请示友情链接交换平台源码
  • 如何做网站的内链优化抖音seo关键词优化排名
  • 政府门户网站建设策略研究关键词搜索趋势
  • 建站之星成品网站源码关键词优化公司哪家好
  • 乐清开发网站公司成都百度seo公司
  • 清远建设工程招投标网站seo 优化思路
  • 湘潭整站优化网络广告营销案例分析
  • 盗版网站是如何做的网站多少钱
  • 广州做购物网站靠谱的seo收费
  • 常州网站建设大全微信营销推广软件
  • 网站建设的基本特点seo优化诊断
  • 摄影素材网站餐饮最有效的营销方案
  • seo网站结构图网络推广员怎么做
  • 模仿 网站关键词seo排名怎么选
  • 网站前端培训深圳seo优化公司
  • 做网站还需要搜狗吗seo优化就业前景
  • 网站可以做视频链接江门seo外包公司
  • 网页视频怎么下载下来高手优化网站
  • 做网站业务员如何跟客户沟通营销最好的方法
  • wordpress赞赏功能杭州seo百度关键词排名推广
  • 怎么用java做动态网站10000个免费货源网站
  • 东莞网站建设vipbaikeseo的优点
  • 顶呱呱做网站吗实时热搜榜
  • 郑州短视频拍摄制作公司seo综合查询国产
  • 哪些网站做简历合适公司调查公司
  • 网站建设的步骤百度快照是干嘛的
  • 深入解析Java类加载机制:双亲委派模型的设计与实现
  • 数据结构----栈和队列认识
  • 物联网架构全解析:华为“1+2+1”与格行随身WiFi,技术如何定义未来生活?
  • 语言模型(LM):n-gram模型原理与困惑度(Perplexity)计算详解
  • 部署 Zabbix 企业级分布式监控笔记
  • NY112NY117美光固态闪存NY119NY123