当前位置: 首页 > news >正文

wordpress调用树形目录/seo综合查询怎么用

wordpress调用树形目录,seo综合查询怎么用,重庆网站建设尚智逢源,proxy网页在线代理前景提要 最近这段时间的CSDN评论增加很快很快,心思把每一个博客网站的评论都拿下来分析一下,看看自己哪里有不足的地方,看看粉丝们都给我评论了什么,根据粉丝的意愿去继续写博客才是个好的博主啊。 网页分析 首先启动检查&…

前景提要

最近这段时间的CSDN评论增加很快很快,心思把每一个博客网站的评论都拿下来分析一下,看看自己哪里有不足的地方,看看粉丝们都给我评论了什么,根据粉丝的意愿去继续写博客才是个好的博主啊。


网页分析

首先启动检查,刷新自己的网页后查看XML中寻找存在评论的XML地址,发现能够找到一共含有的评论页数和当前页面的评论内容。
在这里插入图片描述
该请求参数除 page 之外均为可固定参数, page 为网页访问页数。
在这里插入图片描述
大致参数正确,开始写代码!


完整代码

import urllib
import requests
from lxml import etree
class csdn_comment:def __init__(self,url):self.page_dict = {}if not url[:4] == "http":raise NameError("输入博客地址失败")self.url = urlself.headers = {'User-Agent':"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36",}urls = self.get_url()for url in urls:self.get_page(url)self.get_comment()def get_url(self):html = requests.get(self.url,headers=self.headers)if html.status_code == 200:text = html.textdom = etree.HTML(text)urls = dom.xpath('//*[@id="mainBox"]/main/div[2]/div[*]/h4/a/@href')url = list(map(lambda x:x.split("/")[-1], urls))return urlreturn Nonedef get_page(self,url):data = {'page': '1','size': '10','tree_type': '1','comment_id': ''}page_url = self.url + '/phoenix/comment/list/' + url + "?"+ urllib.parse.urlencode(data)html = requests.post(page_url,headers=self.headers)page_int = html.json()['data']['page_count']self.page_dict[url] = int(page_int)def get_comment(self):one_comment_dict = {}one_comment_list = []self.all_comment_dict = {}for url,all_page in self.page_dict.items():for page in range(1,int(all_page)+1):data = {'page': str(page),'size': '10','tree_type': '1','comment_id': ''}comment_url = self.url + '/phoenix/comment/list/' + url + "?"+ urllib.parse.urlencode(data)html = requests.post(comment_url,headers=self.headers)lists = html.json()['data']['list']for comment_list in lists:comment = comment_list['info']['Content']author = comment_list['info']['NickName']if author:one_comment_dict[author] = commentelse:one_comment_dict['匿名人士'] = commentone_comment_list.append(one_comment_dict)self.all_comment_dict[url] = one_comment_listself.write_json()def write_json(self):import jsonall_comment_str = json.dumps(self.all_comment_dict,ensure_ascii=False)with open('all_comment.txt','w') as f:f.write(all_comment_str)
csdn_comment('CSND博客的URL')

最后还是希望你们能给我点一波小小的关注。

奉上自己诚挚的爱心💖

http://www.lbrq.cn/news/1374301.html

相关文章:

  • 网站权重0/今日热点新闻视频
  • 做繁体书的网站/关键词优化软件哪家好
  • wordpress旅游类网站/深圳网站建设优化
  • html5 手机网站开发/教育培训机构营销方案
  • 世界互联网峰会视频/温州seo团队
  • 广西壮族自治区教育厅/网站seo设计
  • 公司已经有域名 怎么建网站/推广策划方案
  • 网站转小程序/最新社会舆情信息
  • 大安市网站/网络服务器的功能
  • 南京电商网站建设/沈阳网站关键词优化多少钱
  • 个人怎样建网站/微信朋友圈广告30元 1000次
  • 郑州网站制作公司汉狮/怎么建网站赚钱
  • 汉高建设公司网站/快速收录域名
  • java做网站例子/百度收录检测
  • wordpress 钩子教学/南京关键词seo公司
  • 商丘网站建设广告/关键词排名优化品牌
  • 网站建设技术培训/中国最新领导班子
  • 平顶山做网站多少钱/百度推广后台登录页面
  • 做动态网站的软件/百度竞价推广费用
  • 网站开发按几年摊销/长沙网络营销推广公司
  • 做网站具体步骤/列举常见的网络营销工具
  • 《电子商务网站开发与管理》/新站优化案例
  • 做网站的带宽多少钱/企业网站管理
  • 武汉市建设局网站/网络营销与策划
  • 上海门户网站的亮点/seo诊断方法步骤
  • wordpress目录权限设置密码/百度seo排名公司
  • 做网站高流量赚广告费/网站怎么开发
  • 如何做网站的链接结构/浏览器谷歌手机版下载
  • 杭州网站推广平台/促销方法100种
  • 广州联雅做的网站怎么样/拉人注册给佣金的app
  • 【计算机网络】Socket网络编程
  • Oracle 11gR2 Clusterware应知应会
  • 小迪23年-22~27——php简单回顾(2)
  • Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现道路汽车的检测识别(C#代码,UI界面版)
  • SpringMVC的高级特性
  • TCP RTO 与丢包检测