作者 青 暮
编辑 蒋宝尚
经历了长达两周的「骂战」,Yann LeCun 不知是感觉失望还是心累,于今日宣布,将退出推特,不会再在该平台上发表言论。
Yann LeCun 在推特上的最后发声:
请社交网络上的所有人不要再互相攻击了,特别是对 Timnit Gebru 的攻击,以及对于我之前言论的攻击。无论是口头还是任何其他方式的冲突,都只会得到伤害和相反的结果。我反对一切形式的歧视。这将是我在推特上最后一篇帖子。
这场争议起源于提出 PULSE 这一模型的论文,有人用作者在论文中开源的代码进行了模型推理:用奥巴马的打码图像进行了试验,结果发现奥巴马被还原成了白人。
论文地址:https://arxiv.org/pdf/2003.03808.pdf
由于 PULSE 建立在 StyleGAN 的基础上,而 StyleGAN 所用的数据集是 FFHQ,这个数据集里包含了 90% 以上的白人人脸。PULSE 的特点在于,可以将多个不同但相似的人脸图像聚合为同一个低分辨率图像。
许多算法都试图从低分辨率恢复高分辨率图像,这可能是错误的方法,原始图像实际上是信息稀疏的。因此,奥巴马的打码图像还原后也不一定是奥巴马,我们会坚持认为那张图像的原型必然是奥巴马,也是由于记忆先验导致的偏见。PULSE 提供的不是错误的答案,也不是故意的,但提供了有偏见的答案。
针对这张图,Yann LeCun 在推特上发表了这么一句话:“当数据有偏见时,机器学习系统就变得有偏见。这个人脸上采样系统让每个人看起来都像白人,因为网络是在 FlickFaceHQ 数据集上预训练的,而这个数据集主要包含白人图像。”
这为 LeCun 招来了不少的批评,很多专家认为 LeCun 在提出狭隘甚至错误的观点误导人们,并纷纷提出了自己的质疑。LeCun 对这些质疑一一回应,但仍得不到理解。
一开始争论的焦点在于:AI 产生偏见的原因是否只是数据集导致?算法本身的缺陷能不能成为原因?尽管 LeCun 后来在一系列的推文中一条一条地解释自己的观点,指出自己同意各位专家的质疑,只是自己的论点建立在特定的条件下,数据确实不是 AI 偏见的唯一来源。
然而,由于与 LeCun 辩论的专家中有一位是斯坦福 AI Lab 成员、Google AI 黑人女性科学家 Timnit Gebru(非洲裔美国人),“黑人”和“女性”这两个敏感词不知为何成为了众人借题发挥攻击 LeCun 的工具。
争论中走向了真正的“偏见”
作为 AI 的公平性、问责制和透明性的领先研究者,Timnit Gebru 首先在推文中对 LeCun 的言论表示「失望」,并指出机器学习系统中的偏见仅来自数据的观点是不正确的。她还建议 Yann LeCun 查看她之前做过的课程,因为她才是专家。
Yann LeCun 后来在 Timnit Gebru 的推特评论区连写 17 条回复:表示自己同意她的观点。
Timnit Gebru 对此的回应却是:我出于自己的理智不再与您交流,因为这不值得我花费时间。
Yann LeCun 回应:我很遗憾您不愿意讨论实质内容。我曾希望从这种交流中学到一些东西。FB 中有几个小组完全专注于 ML / AI 的公平性,偏见和社会影响。
有人批评 Yann LeCun,并称其向 Timnit Gebru 讲授她的专业知识,居高临下,并涉及言论霸凌。
另外还有人说,Yann LeCun 给该领域的专家提供了推文教程,没有问任何问题,没有进行真正的讨论,没有尊重她的专家地位,也没有要求澄清她的任何观点,还要求她控制情绪,那么又希望她如何参与?其中还有人特别强调了 Timnit Gebru 的黑人女性身份,暗示 Yann LeCun 存在歧视行为。甚至还有人直接批评 Yann LeCun 在进行对女性的“直男”说教。
也有很多人在为 Yann LeCun 辩护,表示他的行为是理性、冷静和有耐心的,并且也称得上是 AI 偏见方面的专家,他不应该为自己没做错的事情道歉。
Yann LeCun 后来在推文中向 Timnit Gebru 表示赞赏她在 AI 道德、公平方面的工作,并对自己的交流方式道歉,希望她能和 Facebook AI 的研究员一起交流如何一起和偏见作斗争。
不过事情并非如此简单,Yann LeCun 又因为另一个言论被卷进了漩涡。当有人说,机器学习研究者应该在选择数据的时候更加小心,Yann LeCun 回应道,这主要是机器学习工程师而不是研究者的责任。人们又开始批评 Yann LeCun 在推卸责任,忽视学术研究对 AI 偏见的影响力。人们也提醒 Yann LeCun,作为领域的领军人物,发表言论应该更加小心。其他人则指出,研究人员在一定程度上必须使用有缺陷的数据集来取得进步。
尽管在这次漫长的争论中,还是有很多人为 Yann LeCun 辩护。但或许,对于 Yann LeCun 来说,这种争论早就脱离了正轨,不应该出现,这本身就是一种失败,是将社交网络应用于 AI 社区交流的失败。由于自己话语的分量,当其中涉及了敏感话题,无论怎么辩解,都会陷入矛盾的中心被围观,最后却得不到有意义的结果。一向直言不讳的 Yann LeCun,这次也心累了。