当前位置: 首页 > news >正文

网络优化怎么弄/seo网页优化培训

网络优化怎么弄,seo网页优化培训,麓谷做网站的公司,深圳手机商城网站设计制作不知道什么时候开始,中国出现了南抖音、北快手的互文格局(东市买骏马,西市买鞍鞯…)。刚才提到了,之前比较喜欢刷抖音,对于我这种佛系程序猿,看网上这些整容妹子基本一个样。喜欢抖音主要是两个…

7e625b228b7cc650f54a116d6eece415.png

不知道什么时候开始,中国出现了南抖音、北快手的互文格局(东市买骏马,西市买鞍鞯…)。刚才提到了,之前比较喜欢刷抖音,对于我这种佛系程序猿,看网上这些整容妹子基本一个样。喜欢抖音主要是两个初衷,学做菜听音乐。朋友之前常说,人家抖音看妹子看的乐呵呵,你看人家做菜也能津津有味,一个人在那儿傻笑…民以食为天,我看到色香味俱全的菜,做的那么好吃的乐呵乐呵还不行么。

抖音捧红了很多人,也让很多本不怎么让大家熟知的歌曲、BGM,经过翻唱、混剪与视频搭配,从而传播大街小巷。什么“若不是你,突然闯进我心里…”亦或者“也许未来遥远在光年之外,我愿守候未知里为你等待…”,成了大家闲时在嘴边哼唱的调调。那么,有没有想过将这些好听的剪辑批量下载下来呢?

Python 链接抖音

python下载抖音内容的帖子网上有一些,但都比较麻烦,需要通过adb连接安卓手机后,模拟操作。我这么懒,这种事儿玩不来…那么,该如何获取抖音内容呢?网上搜了下大概有两种方式,一个是浏览器插件快抖,另外一个是我今天要说的抖音网页版。其实这两者差别不是很大,都是先将抖音内容下载至服务器后,通过开发简单网站配置域名后,让大家访问。让我们来看看抖音网页版

a4c681d993c478c4ba455f2d18b59988.png

哎哟吼,居然看到了昨天爬虫的“乔奶奶”…当然今天的重点不是视频,而是下载它全站所有的音乐

爬虫实现分析

994f0f3d545d8abfa3a7c6cdf43c48db.png

大家先开看看这个抖音热歌榜歌曲,每页20首歌曲,一个55页。但细不细心大家都能发现,很多歌曲存在重复的问题。所以,等下爬虫的时候,我们需要先准备一个music_list,用来识别这首歌曲是否已经下载过了…

  • 网页解析

74b8f353f7a7e97aada79a68a095b948.png

网页比较简单,一个div中包裹了一个ul>li*20,我们是不是该这样获取:

soup.find('div',{"class":"pull-left"}).find('ul').findAll('a')

通过使用attr的属性进行快速解析,那么最快速的获取方式是:

soup.findAll('a', attrs={'onclick': True})

我们只需要获取所有的a标签,切这些标签中包含onclick这个属性即可。

  • 巧用eval

我们解析到的内容通过attr[‘onclick’],可以得到他的属性open1(‘夜’,’http://p9-dy.byteimg.com/obj/61a2000…),如何能快速获取歌曲名字和url呢?这里我们需要用到一个eval的小技巧:

index = "open1('夜','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')"
index[5:]
"('夜','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')"
index_tuple = eval(index[5:])
print(index_tuple, type(index_tuple))
('夜', 'http://p9-dy.byteimg.com/obj/61a20007a98954b0831d', '') <class 'tuple'>
index_tuple[0]
'夜'
index_tuple[1]
'http://p9-dy.byteimg.com/obj/61a20007a98954b0831d'

ps:今天一个朋友说我写代码没注释,我这是现身说法的告诉你,如何能写出让别人压根看不懂的代码,就是不写注释啊,哈哈!其实,代码我都在文章中一点一点的讲解了,所以没有写,但秉承着害怕大佬们取关的心态,我还是把注释加上吧…

代码实现

总体来说实现比较简单,全部代码如下:

import osimport requests
from bs4 import BeautifulSoup
import threading
import timeclass DouYinMusic:def __init__(self):self.music_list = []self.path = self.download_path()@staticmethoddef download_path():"""获取代码执行目录,并在目录下创建Music文件夹:return Music文件夹全路径"""base_dir = os.path.dirname(os.path.abspath(__file__))_path = os.path.join(base_dir, "Music")if not os.path.exists(_path):os.mkdir(_path)return _pathdef get_request(self, url):"""封装requests.get方法如果为网页请求,返回网页内容否则,解析音乐地址,并返回音乐二进制文件:param url: 请求url(分网页、音乐两类):return: 网页内容 & 音乐二进制文件"""r = requests.get(url, timeout=5)if url.endswith('html'):return r.textelse:return r.contentdef analysis_html(self, html):"""根据获取的网页内容,解析音乐名称、下载地址调用音乐下载方法:param html: 网页内容"""soup = BeautifulSoup(html, 'lxml')# 根据关键字onclick查找每个下载地址for tag_a in soup.findAll('a', attrs={'onclick': True}):# 下载格式'("name","link","")',通过eval将str转化为tuple类型link_list = eval(tag_a['onclick'][5:])music_name, music_link = link_list[:2]# 因为存在部分重复音乐,故设置判断下载过的音乐跳过if music_name in self.music_list:continueself.music_list.append(music_name)t = threading.Thread(target=self.download_music, args=(music_name, music_link))time.sleep(0.5)t.start()def download_music(self, music_name, music_link):"""解析音乐文件,完成音乐下载:param music_name: 音乐名称:param music_link: 下载地址"""_full_name = os.path.join(self.path, music_name)with open(_full_name + '.mp3', 'wb') as f:f.write(self.get_request(music_link))print("抖音音乐:{} 下载完成".format(music_name))def run(self):"""主方法,用于批量生成url"""for page in range(1,55):url = "http://douyin.bm8.com.cn/t_{}.html".format(page)html = self.get_request(url)self.analysis_html(html)if __name__ == '__main__':main = DouYinMusic()main.run()

来让我们看看效果吧:

e4598b2a2cda48810f41850edc555404.png

网站是通过nginx负载均衡搭建的,有一些链接已经失效了。最终下载了不重复的592首抖音音乐

255b4302eceb8a6707b7f62fe84bb141.png

同样的,大家喜欢可以按照这种方法,尝试下载一下网站的抖音视频。

声明:本文内容来源于网络,如有侵权请联系删除
http://www.lbrq.cn/news/1398493.html

相关文章:

  • 区域网站查询/合肥网站seo整站优化
  • 服装公司网站建设/seo优化工作内容
  • 网站创建流程包括哪些步骤/seo网站优化
  • 大学生建设什么网站好/app推广接单
  • 好的网站样式/如何建网址
  • 张家港网站建设公司/网站流量监控
  • 信息公开和网站建设工作总结/赚钱平台
  • 大型地方门户网站源码/网页设计网站
  • 用什么软件做网站图片/推广点击器
  • 门户网站系统介绍/短视频培训机构
  • 学校网站建设意义/宁德市古田县
  • 中山技术支持中山网站建设/一手渠道推广平台
  • 企业网站开发数据库设计/谷歌搜索引擎大全
  • 玉环专业做网站/百度关键字搜索排名
  • 软件平台运维方案/谷歌sem和seo区别
  • 银川网站建设效果/seo优化排名价格
  • 二手交易网站建设/cba最新积分榜
  • 东莞做阀门的网站/如何做网络推广运营
  • 小程序数据网/长春网站seo哪家好
  • 网站建设乐云seo/济南seo优化外包
  • 自己怎么开网站备案/成都排名推广
  • 微信网站怎么开发/免费下载百度app最新版本
  • 网站搭建协议/地推网app推广平台
  • 做网站之前的前期/广告公司推广渠道
  • java可以做网站开发吗/数据分析网
  • 手机网站建设宣传好/seo关键词优化如何
  • 火影忍者做网站的超帅图片/合肥做网站推广
  • 重庆的企业的网站建设/网络营销与电子商务的区别
  • 行业门户网站制作/网店搜索引擎优化的方法
  • 湖南火电建设有限公司招标网站/制作app平台需要多少钱
  • LeetCode 刷题【47. 全排列 II】
  • 细说数仓中不同类型的维度
  • Java并发容器详解
  • 27.语言模型
  • 当机器猫遇上具身智能:一款能读懂宠物心思的AI守护者
  • Python + 淘宝 API 开发:自动化采集商品数据的完整流程​