2 月 9 日消息,在当今的网络环境中,验证码(CAPTCHA)已成为我们登录各类网站时的常见环节。当你登录网站时,可能会看到一张显示扭曲数字和字母的图片,并被要求输入这些内容以证明自己是人类。这种被称为 CAPTCHA(全自动区分计算机和人类的图灵测试)的测试,广泛应用于网站,以防止机器人攻击和垃圾邮件。
2007 年,路易斯・冯・安(Luis von Ahn)提出了一个巧妙的想法:为何不利用 CAPTCHA 来帮助数字化那些计算机难以识别的书籍和报纸扫描文本呢?于是,他创造了 reCAPTCHA,这一工具被证明极为有效,《纽约时报》甚至利用它来数字化其自 1851 年以来的 1300 万篇文章的档案。2009 年,谷歌收购了 reCAPTCHA,并将其应用于谷歌图书的数字化以及通过处理街景标志和门牌号照片来改进谷歌街景服务。
然而,时至 2025 年,reCAPTCHA 系统已容易被机器人攻破。尽管如此,谷歌仍继续提供这一服务。据 Chuppl 报道,reCAPTCHA 已演变为一种追踪工具,用于收集用户数据并为谷歌创造数十亿美元的收入。“reCAPTCHA 会对你的浏览器进行逐像素指纹识别,实时记录你在互联网上的一切行为。”前加州大学欧文分校计算机安全研究员安德鲁・西尔斯(Andrew Searles)博士表示:“它实质上可以获取用户在该网页上的任何交互数据。”
西尔斯博士的研究论文《迷惘与困惑:一项针对 reCAPTCHA v2 的大规模现实世界用户研究》指出,谷歌广泛使用的 CAPTCHA 系统主要是一种追踪用户行为和收集数据的机制,而在防止机器人攻击方面提供的实际安全性微乎其微。研究发现,reCAPTCHA 广泛监控用户的 Cookie、浏览历史和浏览器环境(包括画布渲染、屏幕分辨率、鼠标移动和用户代理数据),所有这些数据均可用于广告和追踪目的。
通过对 3600 多名用户的分析,研究人员发现,解决基于图像的验证挑战所需时间比复选框验证多出 557%。研究还估计,reCAPTCHA 已浪费社会约 8.19 亿小时的人力时间,按工资计算价值 61 亿美元(备注:当前约 444.94 亿元人民币),同时通过其追踪能力和数据收集为谷歌创造了巨额利润,仅追踪 Cookie 的价值就估计高达 8880 亿美元(当前约 6.48 万亿元人民币)。
遗憾的是,用户目前尚无方法可以完全避开 reCAPTCHA 系统。