Python全系列 教程
3567个小节阅读:5931.3k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
https://www.ximalaya.com/yinyue/
备注
了解如何分析URL地址,与构造URL参数的思路即可。使用别的网站也可以测试,因为网站随时有可能会变
xxxxxxxxxx
from urllib.request import Request,urlopen
from time import sleep
def spider_music(_type,page):
# 构造URL地址
for num in range(1,page+1):
if num == 1:
url = f'https://www.ximalaya.com/yinyue/{_type}'
else:
url = f'https://www.ximalaya.com/yinyue/{_type}/p{num}/'
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.63 Safari/537.36'}
# 构造请求对象
req = Request(url,headers=headers)
# 发送请求
resp = urlopen(req)
# 获取响应
print(resp.getcode())
print(resp.geturl())
# print(resp.read().decode()[:2000])
# 休眠
sleep(1)
if __name__ == '__main__':
spider_music('minyao',3)