目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

Python全系列 教程

3567个小节阅读:5930.5k

收藏
全部开发者教程

鸿蒙应用开发

C语言快速入门

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(1.4k)
赞(0)

图片验证码介绍

image-20220728165927607

介绍

验证码(CAPTCHA)是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写。也就是说,这个东西最开始设计的目的,就是为了区分请求来自机器还是人类。可想而知,验证码就是为了反爬而生的。如果这个世界没有爬虫,可能也就不会诞生验证码

早期,那个时候验证码只是能够把一些简单的文字转换成图片让来识别,但也是一大杀器了。因为在 OCR 技术(Optical Character Recognition,光学字符识别)还不发达的时候,验证码可以说秒杀所有的爬虫。但是后来随着 OCR 的发展,识别验证码已经沦落为机器学习的入门课程,成了学生练手项目。最开始无敌的验证码,就这样被时代秒杀了

image-20220728200354385

现在的验证码变得越来越奇葩,已经不仅仅是图片识别成文字的形式了。例如 Google 的找出自行车、12306 的找出手表,甚至一些网站的出现各种动态验证码等等,原本用于识别人类的验证码,逐渐变得越来越反人类

image-20220728200504739image-20220728200544174

为什么越来越反人类?

随着老龄化的到来,越来越多的年龄极端人开始使用互联网。这个时候你用验证码让他算一个复杂的算式?或者让他找出图片里的佩奇——“嗯?啥是佩奇?”。验证码已经很难检测人类了,误伤人类的本事倒是越来越大。

使用场景

  • 注册
  • 登录
  • 频繁发送请求时,服务器弹出验证码进行验证
  • ...

处理方案

  • 手动输入(input) 这种方法仅限于登录一次就可持续使用的情况

  • 图像识别引擎

    • Tesseract

      • Tesseract,一款由HP实验室开发由Google维护的开源OCR引擎,特点是开源,免费,支持多语言,多平台。
    • TensorFlow

      • TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习,目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索
    • PyTorch

      • PyTorch是一个开源Python机器学习库,基于Torch,用于自然语言处理等应用程序

        • PyTorch是相当简洁且高效快速的框架
        • 设计追求最少的封装
        • 设计符合人类思维,它让用户尽可能地专注于实现自己的想法
        • 与google的Tensorflow类似,FAIR的支持足以确保PyTorch获得持续的开发更新
        • PyTorch作者亲自维护的论坛 供用户交流和求教问题
        • 入门简单 [2]
  • 打码平台

    爬虫常用的验证码解决方案

实时效果反馈

1. 关于验证码, 说法错误的是?

A 验证码主要区分是机器还是人

B 验证码分为多种类型

C 验证码破解必须使用机器学习

D 不同验证码破解方式不同

答案

1=>C

 

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2