我不得不觉得现在互联网上的一切都需要验证码。我这么像机器人吗?机器人会去xxxhub吗?
连验证码's的一些困难,真人都认不出来,都这么复杂?
事实上,随处可见的验证码,不仅在验证我们是否是人类,还让用户免费变成了打工,人们还没有意识到这个「骗局」.
第一:证明你是一个人。
验证码是低成本高收益,的一个方案,可以阻止来自根本上,的机器和脚本的恶意攻击,因为它只需要验证你是不是真人,如果不是,直接拒绝。
它也可以被引入到复制,的任何系统中,所以你现在可以在任何地方看到它,它也区分了有意思或高血压.的各种验证码类型
例如,最简单的数字、字母、单词,以及推导出的简单数学计算,所有这些都是字符识别.
移动滑块和旋转图像可以归类为位置识别.
识别物体,识别红绿灯和斑马线。这些是物体识别.的
甚至还有各种其他的东西,欢迎大家补充。
难道这些形形色色的验证码仅仅是为了安全才难吗?不,还有一个隐藏目的:让用户免费作为它的打工.
02互联网上最大的骗局
由于21世纪的信息时代刚刚到来,大量的纸质资料和书籍需要数字化,手工录入必须是不可能.
是的,但是机器扫描很容易扫描失败。
面对这个问题,reCAPTCHA的创始人之一提出了一个好主意:我们可以利用验证码系统来让人类帮助识别那些机器扫描不出来的文字?吗
这样可以将人和机器的优势结合起来,提高工作效率。
与此同时,验证码还得为区分人机,会见最基本需求所以有一个非常巧妙的办法:
用户在验证码.看到了有一部分是正常用于验证的文字、而另一部分是机器无法识别的文字
用户输对了用于验证的部分,该机将由假设另一部分也正确识别,和交叉验证的多个用户组合而成。
,
就成功帮助机器识别了那些不能识别的文字。也就是说,人们在输验证码时,其实前半段就已经完成验证,而后面则是在 义务劳动 。
借助这个系统,每天都能录入 几亿 字符,大量书籍完成了数字化工作,可以说为人类文明做出了 巨大贡献 。
那照这样下去很快就没有书籍需要数字化了吧?
恰逢 人工智能 和 机器学习 的发展,这套系统开始有了新的工作: 辅助训练 AI 。
这下验证码也从 字符识别 发展成了更加复杂的 物体识别 ,我们又在无形之中为 AI 的发展出了一份力。
天天区分红绿灯、斑马线的无偿劳动,谷歌自动驾驶出来是不是得一人发一辆车啊?
03 AI 对抗 AI
原来我在填验证码的时候, 不仅仅 是证明了我是一个人,同时也在辅助训练 AI 。
这让我不禁想到了一个问题:AI 学会了识别字符、图片,那是不是可以 用 AI 来破解验证码?答案是可以的,并且还无法避免。
Google 通过 API 本身向开发人员开放了 TensorFlow,意味着可以 使用 TensorFlow 来欺骗训练 TensorFlow
的验证码系统 。
这就好比,师父为了防止徒弟打开自己的宝箱而上了一把锁,但是师父教给徒弟的技能就是去开这种锁,最终徒弟也能打开师父的锁,但师父最不能忍受的就是徒弟能打开自己的锁。
矛盾吧?
既然这样,又要怎样才能区分人和机器呢?
04 新的验证方式
reCAPTCHA 推出了 更加有效的验证系统 ,通过直接 记录识别用户操作轨迹 来区分人与机器,提高机器模拟成本。
相比于传统验证系统,它并不需要用户进行点图片、输文字验证,它的工作机制是跟踪用户点击验证框 之前、当时和之后 的各种行为。
比如在网页上花费的时间、点击滑动次数,综合分析给出 评分 ,从而来判断是否是人为操作。
但经过训练的 AI 还是可以突破这道验证 ,未来甚至会有更多的方案。
只能说,AI 对抗训练 AI 的验证码系统是 无法避免的 ,虽然可以不断提高机器模拟成本来不断延后这个结果。但最终对用户来说,
我们可能更难向服务器证明「我是人」了。
现在的验证码,且用且珍惜。