当前位置: 首页 > news >正文

ps做素材下载网站好消息tvapp电视版

ps做素材下载网站,好消息tvapp电视版,wordpress收藏本站代码,wordpress修改自定义尺寸logo这篇文章主要介绍了Python BeautifulSoup中文乱码问题的2种解决方法,需要的朋友可以参考下 解决方法一: 使用python的BeautifulSoup来抓取网页然后输出网页标题,但是输出的总是乱码,找了好久找到解决办法,下面分享给大家 首先是代码 复制代码 代码如下: 在刚开始测试…

这篇文章主要介绍了Python BeautifulSoup中文乱码问题的2种解决方法,需要的朋友可以参考下

解决方法一: 使用python的BeautifulSoup来抓取网页然后输出网页标题,但是输出的总是乱码,找了好久找到解决办法,下面分享给大家 首先是代码 复制代码 代码如下:

在刚开始测试的时候发现,虽然输出是乱码的,但是写在文件里面却是正常的.然后在网上找了找解决办法才发现 print一个对象的逻辑:内部是调用对象的__str__得到对应的字符串的,此处对应的是soup的__str__ 而针对于soup本身,其实已经是Unicode编码,所以可以通过指定__str__输出时的编码为GBK,以使得此处正确显示非乱码的中文 而对于cmd:(中文的系统中)编码为GBK,所以只要重新编码为gb18030就可以正常输出了 就是下面这行代码 复制代码 代码如下: print (soup.title).encode('gb18030')

from bs4 import BeautifulSoup
import urllib2url = 'http://www.jb51.net/'
page = urllib2.urlopen(url)soup = BeautifulSoup(page,from_encoding="utf8")
print soup.original_encoding
print (soup.title).encode('gb18030')file = open("title.txt","w")
file.write(str(soup.title))
file.close()for link in soup.find_all('a'):print link['href']

解决方法二: BeautifulSoup在解析utf-8编码的网页时,如果不指定fromEncoding或者将fromEncoding指定为utf-8会出现中文乱码的现象。 解决此问题的方法是将Beautifulsoup构造函数中的fromEncoding参数的值指定为:gb18030 复制代码 代码如下:

import urllib2
from BeautifulSoup import BeautifulSouppage = urllib2.urlopen('http://www.jb51.net/');
soup = BeautifulSoup(page,fromEncoding="gb18030")
print soup.originalEncoding
print soup.prettify()

 

转载于:https://www.cnblogs.com/wuzhi-seo/p/5512302.html

http://www.lbrq.cn/news/2396935.html

相关文章:

  • 如何做网站权重微信营销推广方案
  • 武汉去施工网今日招工seo千享科技
  • 家居在线设计平台广州网站优化多少钱
  • 深圳做营销网站设计广告商对接平台
  • 开个网站做英语培训百度网站收录
  • 高端大气网站欣赏竞价推广和信息流推广
  • 厦门市网站建设局设计网站
  • 和田知名网站建设企业怎么优化关键词
  • 江阴做网站公司怎么提高百度关键词排名
  • 什么网站做简历模板seo研究中心道一老师
  • 有哪些网站做的比较好看的长春网站seo
  • 服装官网网站建设百度竞价托管哪家好
  • 营销网站建设规划概念提供搜索引擎优化公司
  • wordpress转bitcronseowhy教研室
  • 深圳建站公司的小技巧市场营销案例100例
  • 如何在局域网内做网站网站功能优化
  • web网站开发分享网站武汉百度推广优化
  • 东莞做网站公司有哪些收录批量查询工具
  • 做网站都注意哪些东西百度营销登录入口
  • 微信看视频打赏网站建设头条新闻最新消息
  • 医院网站 功能google seo是什么
  • wordpress 图片网站推销产品的软文500字
  • 用模板做网站的方法免费seo培训
  • 做名片制作网站有什么软文发布软件
  • 网站建设修改营销网站建设哪家好
  • 朝阳专业网站建设公司产品销售方案与营销策略
  • 网站建设与规划实验心得百度seo关键词优化电话
  • 深圳建设网站公司全球访问量top100网站
  • 针对人群不同 网站做细分关键词三年级
  • 物联网开发平台新河seo怎么做整站排名
  • 锂电池充电芯片
  • 测试计划(抽奖系统)
  • 深入理解DNS原理与服务的详细配置
  • 读书笔记:《动手做AI Agent》
  • 某邮生活旋转验证码逆向
  • 域名WHOIS信息查询免费API使用指南