Python全系列 教程
3567个小节阅读:5929.9k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
需求: 使用正则获取腾讯新闻标题内容
xxxxxxxxxx
import re
import requests
from fake_useragent import UserAgent
url = 'https://sports.qq.com/'
# 构建请求头信息
headers = {'User-Agent':UserAgent().chrome}
# 发送请求
resp = requests.get(url,headers=headers)
# 设置字符集
resp.encoding ='gbk'
# # 保存数据
# with open('tmp.html','w',encoding='utf-8') as f:
# f.write(resp.text)
# 匹配数据
rs = re.findall(r'<li><a target="_blank" href=".+>(.+)</a></li>',resp.text)
# re.findall(r'<li><a target="_blank" href=".+?>(.+)</a>',resp.text)
for r in rs:
print(r)