目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

Python全系列 教程

3567个小节阅读:5931.1k

收藏
全部开发者教程

鸿蒙应用开发

C语言快速入门

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(3.6k)
赞(0)

伪装自己的爬虫-设置代理

image-20220517184823737

爬虫设置代理就是让别的服务器或电脑代替自己的服务器去获取数据

爬虫代理原理

image-20220517194117904

代理分类

  • 透明代理:目标网站知道你使用了代理并且知道你的源IP地址,这种代理显然不符合我们这里使用代理的初衷

  • 匿名代理:匿名程度比较低,也就是网站知道你使用了代理,但是并不知道你的源IP地址

  • 高匿代理:这是最保险的方式,目标网站既不知道你使用的代理更不知道你的源IP

代理网站

代理网站目前可用,但不一定稳定。毕竟这个产业目前情况就是这样。

注意

代理IP无论是免费,还是付费,都不能保证一定可用

  • 可能此IP已被其他人使用爬取同样的目标网站而被封禁
  • 代理服务器突然发生故障或网络繁忙

代码

实时效果反馈

1. 关于爬虫,代理爬虫说法错误的?

A 设置代理IP目的就是隐藏自己的IP

B 设置代理一定可以隐藏自己的IP

C 代理爬虫会降低爬虫效率

D 代理爬虫不一定要设置

2. 关于代理IP,说法错误的?

A 代理IP隐匿程度不同

B 代理IP有免费,也有收费

C 高匿代理最可靠的代理IP

D 所有代理IP直接指定IP与端口就好

答案

1=>B 2=>D

 

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2