Python全系列 教程
3567个小节阅读:5931.1k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
爬虫设置代理就是让别的服务器或电脑代替自己的服务器去获取数据
透明代理:目标网站知道你使用了代理并且知道你的源IP地址,这种代理显然不符合我们这里使用代理的初衷
匿名代理:匿名程度比较低,也就是网站知道你使用了代理,但是并不知道你的源IP地址
高匿代理:这是最保险的方式,目标网站既不知道你使用的代理更不知道你的源IP
代理网站目前可用,但不一定稳定。毕竟这个产业目前情况就是这样。
小象代理
66ip 代理 http://www.66ip.cn
注意
代理IP无论是免费,还是付费,都不能保证一定可用
- 可能此IP已被其他人使用爬取同样的目标网站而被封禁
- 代理服务器突然发生故障或网络繁忙
xxxxxxxxxx
from urllib.request import build_opener,Request,ProxyHandler
from fake_useragent import UserAgent
url = 'http://httpbin.org/get'
header = {'User-Agent':UserAgent().chrome}
req = Request(url,headers=header)
# 构建一个可以使用代理的控制器
# ProxyHandler({'type':'ip:port'})
# handler = ProxyHandler({'http':'122.9.101.6:8888'})
handler = ProxyHandler({'http':'http://398707160:j8inhg2g@162.14.117.8:16816'})
# 构建一个opener对象
opener = build_opener(handler)
# 发送请求
resp = opener.open(req)
# 打印结果
print(resp.read().decode())
实时效果反馈
1. 关于爬虫,代理爬虫说法错误的?
A 设置代理IP目的就是隐藏自己的IP
B 设置代理一定可以隐藏自己的IP
C 代理爬虫会降低爬虫效率
D 代理爬虫不一定要设置
2. 关于代理IP,说法错误的?
A 代理IP隐匿程度不同
B 代理IP有免费,也有收费
C 高匿代理最可靠的代理IP
D 所有代理IP直接指定IP与端口就好
答案
1=>B 2=>D