当前位置: 首页 > news >正文

大家做网站都会去哪找素材关键词资源

大家做网站都会去哪找素材,关键词资源,做wow宏的网站,昆明网络建站公司这篇文章主要介绍了Python BeautifulSoup中文乱码问题的2种解决方法,需要的朋友可以参考下 解决方法一: 使用python的BeautifulSoup来抓取网页然后输出网页标题,但是输出的总是乱码,找了好久找到解决办法,下面分享给大家 首先是代码 复制代码 代码如下: 在刚开始测试…

这篇文章主要介绍了Python BeautifulSoup中文乱码问题的2种解决方法,需要的朋友可以参考下

解决方法一: 使用python的BeautifulSoup来抓取网页然后输出网页标题,但是输出的总是乱码,找了好久找到解决办法,下面分享给大家 首先是代码 复制代码 代码如下:

在刚开始测试的时候发现,虽然输出是乱码的,但是写在文件里面却是正常的.然后在网上找了找解决办法才发现 print一个对象的逻辑:内部是调用对象的__str__得到对应的字符串的,此处对应的是soup的__str__ 而针对于soup本身,其实已经是Unicode编码,所以可以通过指定__str__输出时的编码为GBK,以使得此处正确显示非乱码的中文 而对于cmd:(中文的系统中)编码为GBK,所以只要重新编码为gb18030就可以正常输出了 就是下面这行代码 复制代码 代码如下: print (soup.title).encode('gb18030')

from bs4 import BeautifulSoup
import urllib2url = 'http://www.jb51.net/'
page = urllib2.urlopen(url)soup = BeautifulSoup(page,from_encoding="utf8")
print soup.original_encoding
print (soup.title).encode('gb18030')file = open("title.txt","w")
file.write(str(soup.title))
file.close()for link in soup.find_all('a'):print link['href']

解决方法二: BeautifulSoup在解析utf-8编码的网页时,如果不指定fromEncoding或者将fromEncoding指定为utf-8会出现中文乱码的现象。 解决此问题的方法是将Beautifulsoup构造函数中的fromEncoding参数的值指定为:gb18030 复制代码 代码如下:

import urllib2
from BeautifulSoup import BeautifulSouppage = urllib2.urlopen('http://www.jb51.net/');
soup = BeautifulSoup(page,fromEncoding="gb18030")
print soup.originalEncoding
print soup.prettify()

 

转载于:https://www.cnblogs.com/wuzhi-seo/p/5512302.html

http://www.lbrq.cn/news/2374975.html

相关文章:

  • 如何访问自己做的网站企业管理咨询培训
  • 做韦恩图的网站长春网站seo公司
  • 做网站如何不被忽悠公司网站设计与制作
  • 厦门网站免费制作seo内部优化方式包括
  • 做界面的网站苏州百度关键词优化
  • 如何做网站地图txt海口seo计费
  • 学校网站的建设需求重庆森林电影高清在线观看
  • 网站内容优化方法国内搜索引擎排名
  • 临城网站建设服务热线手游推广平台有哪些
  • 上海营销型网站seo推广链接点击器安卓版
  • 做网站一条龙五合一网站建设
  • 手机网站建设西安网络营销产品的首选产品
  • 中山网站建设公司哪个好深圳网络营销软件
  • 网站建设公司项目介绍百度收录的网站多久更新一次
  • 二环建设部网站微信scrm系统
  • 测试网站怎么做的山东seo网络推广
  • 软件定制公司官网seo方式包括
  • 公众号建网站seo需要懂代码吗
  • 制作网站网站站长工具seo推广 站长工具查询
  • 教做年糕博客网站深圳百度关键字优化
  • 怎么做网站的跳转最近的国际新闻
  • 重庆政府采购网站官网seo软文推广工具
  • 建设一个企业网站要多少钱廊坊百度推广seo
  • 优秀网站设计分析怎么做好推广
  • 网站做留言板b站推广入口2023破解版
  • 怎样做网站跳转下载百度推广app
  • 模板网站建设价位seo搜索优化邵阳
  • 门户网站直接登录系统企业培训机构排名
  • 有哪些公司做网站seo jsbapp9
  • wordpress获取评论广州网站优化服务
  • display:flex弹性布局
  • 分布式分片策略中,分片数量的评估与选择
  • 《图解技术体系》Four Implementation Methods of Distributed Transactions
  • 信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代
  • Python爬虫实战:研究PyYAML库相关技术
  • Unity沉浸式/360View/全景渲染