当前位置: 首页 > news >正文

忻州 建网站/专业网站推广软件

忻州 建网站,专业网站推广软件,学校校园网站建设实践选题背景,信息推广平台有哪些文章目录获取逻辑上代码今天搜刮网上的KaoYan题,发现一个网站有【kaoyan历年真题】 除了注册一个账户, 还得必须一个一个点“真题” “答案”,下载完成之后,还得一个一个手动改文件名,甚是磨手指头。 于是稍稍分析了…

文章目录

    • 获取逻辑
    • 上代码

今天搜刮网上的KaoYan题,发现一个网站有【kaoyan历年真题】

除了注册一个账户, 还得必须一个一个点“真题” “答案”,下载完成之后,还得一个一个手动改文件名,甚是磨手指头。

于是稍稍分析了一下网站,发现可以用爬虫下载…嘿嘿

获取逻辑

  1. 获取每个科目对应的code , 直接附上api: https://college.koolearn.com/v1/past-exam-paper/exam-courses(POST请求)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-48GNE5m1-1642398169624)(C:\Users\mild\AppData\Roaming\Typora\typora-user-images\image-20220117133207858.png)]

  1. code 请求科目,解析近十年的真题与答案PDFURL, 比如数二的API: https://college.koolearn.com/v1/past-exam-paper/exam-course/122 (POST请求) ,请求要加上data字典参数
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yfhrq0Sg-1642398169624)(C:\Users\mild\AppData\Roaming\Typora\typora-user-images\image-20220117133738340.png)]

    请求成功后,JSON如下

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rD6DLllY-1642398169624)(C:\Users\mild\AppData\Roaming\Typora\typora-user-images\image-20220117133801751.png)]

  1. 下载保存PDF

上代码

可以直接运行滴,运行结果如下:
在这里插入图片描述

# encoding: utf-8
# @time :  2022-01-17 11:53:00
# @file : LiNianZhenTi.py
# @software : PyCharm
# @author : Ading
# blog : https://blog.csdn.net/m0_46156900import json
import osimport requestsapi_code = 'https://college.koolearn.com/v1/past-exam-paper/exam-courses'  # 获取不同科目的code
api_pdf = 'https://college.koolearn.com/v1/past-exam-paper/exam-course/{}'  # 获取某个科目,历年试卷
pdf_dir = './历年真题'
data = {   # 默认data'endYear': '2021','startYear': '2010'
}def getJson(url, method="POST", code=None):  # 请求网站try:if code:url = url.format(code)r = requests.request(method=method, url=url, timeout=5, data=data)r.raise_for_status()else:r = requests.request(method=method, url=url, timeout=5)r.raise_for_status()return r.textexcept:print("请求失败:", url)def parseJson(text):data = json.loads(text)['data']if 'publicCourse' in data.keys() or 'majorCourse' in data.keys():print('解析各科对应的code: ')for course in data['publicCourse']:print(course['name'], ':', course['code'])for course in data['majorCourse']:print(course['name'], ':', course['code'])print('开始下载...')for course in data['publicCourse']:parseJson(getJson(api_pdf, code=course['code']))  # 递归解析下载公共课for course in data['majorCourse']:parseJson(getJson(api_pdf, code=course['code']))  # 递归解析下载专业课else:print(f'准备下载{data["subjectName"]}:')for paper in data['pastExamPapers']:saveJson(paper, course=data["subjectName"])def saveJson(exam, course):if not os.path.isdir(pdf_dir):  # 创建路径os.mkdir(pdf_dir)print(f'正在下载: {exam["examPaperName"]}')fn = pdf_dir+"/"+courseif not os.path.isdir(fn):  # 创建科目文件夹os.mkdir(fn)with open(f"{fn}/{exam['examPaperName']}.pdf",'wb') as f:  # 保存试题if exam["examPaperUrl"]:f.write(requests.get(exam["examPaperUrl"]).content)with open(f"{fn}/{exam['examPaperName']}_ans.pdf",'wb') as f:  # 保存试题答案if exam["examPaperAnswerUrl"]:f.write(requests.get(exam["examPaperAnswerUrl"]).content)if __name__ == '__main__':codeText = getJson(url=api_code)parseJson(codeText)

考研加油朋友们

http://www.lbrq.cn/news/1067041.html

相关文章:

  • 中华住房与城乡建设厅网站/企业营销策划是做什么的
  • 用php做网站要用构架吗/苏州seo网站公司
  • 生物制药公司网站建设/中国十大电商公司排名
  • 网站的营销方式有哪些/seo 专业
  • 济南网站建设公司哪个好/智谋网站优化公司
  • 网站左侧导航代码/网站域名购买
  • 网站怎么接入百度地图/凡科建站怎么建网站
  • 网站的设计原则/seo关键词优化举例
  • 中企动力网站价格/郑州官网网络营销外包
  • wordpress小工具不能完全显示/菏泽地网站seo
  • 禹城做网站的公司/深圳全网推广排名
  • 服务器怎么做看视频的网站/长春seo排名外包
  • 佛山网站建设佛山网络推广/seo与sem的区别
  • 怎么搭建自己的网站服务器/百度网盘帐号登录入口
  • 广州高端网站设计/疫情放开最新消息今天
  • 网站建设站点无法发布/百度网址大全网站大全
  • 返利淘客网站源码/平台推广方式方法是什么
  • 网站建设中网站需求分析和报告工能论文/网络营销模式下品牌推广研究
  • 效果图哪个网站好/杭州网络推广外包
  • 北京南站到北京站/巨量引擎官网
  • 网站里面的图片做桌面不清晰度/百度seo关键词优化电话
  • 刚注册在域名可以自己做网站吗/淘宝关键词查询
  • 鹿泉区城乡建设局网站/指数搜索
  • 提供网站建设报/优秀网页设计
  • 阿里云服务器做网站/网店网络推广方案
  • 网站商城建设/西安网红
  • 怎么做好网站推广/seo实战密码第四版pdf
  • 徐州做网站的公司招聘/seo关键词优化的技巧
  • 手机做车载mp3下载网站/黑帽seo寄生虫
  • 湘潭专业网站建设湘潭振企专业/互联网营销推广怎么做
  • 配置Mybatis环境
  • 关于Web前端安全之XSS攻击防御增强方法
  • python匿名函数lambda
  • i Battery Box V3.7 客户端电池检测仪
  • kotlin小记(1)
  • linux编译基础知识-头文件标准路径