一提到计算机,人们第一时间想到的就是埋在电脑前敲代码的理工男。但事实上第一个设计出编译程序并发现 BUG 的人是一位杰出的女性,她就是 Grace Murray Hopper,人称计算机软件工程第一夫人。
2020年3月8日,在这个一年一度的妇女节里,清华大学 – 中国工程院知识智能联合研究中心、清华大学人工智能研究院与北京智源人工智能研究院隆重发布人工智能全球女性榜单(Women in AI),旨在通过 AMiner 学术数据在全球范围内遴选人工智能学科最有影响力、最具活力的女性学者。
通过大数据分析、经技术专家委员会商议,参考相关领域顶级期刊发布的论文,2020年1月发布了2000位人工智能全球最具影响力 AI 学者榜单,即 AI 2000(www.aminer.cn/ai2000)。
在 AI 2000的所有学者中,有179位是女性学者。虽然仅有9%,不过这个数字已经远远超出了大多数人的想象。要知道,在人工智能逐渐从实验室走向实践应用的时代,能被业界谈论的女性人工智能科学家,也只有攻克了计算机视觉识别的李飞飞。
国家分布
从国家分布来看,179位女性学者分布于全球21个国家。其中超过60% 的学者来自于美国,共116位。一方面,美国的科研实力确实强大,另一方面,美国先进的科学思想也在激励着女性科学家跨越性别带来的障碍。
在 AI 2000的榜单中,美国女性科学家占美国科学家总数的10%。此外,英国、加拿大和法国,更是占据超过15% 的总比数。与之相反,我国女性科学家占总比数约为7%,证明我国在培养女性科学家方面还可以提高。当然,这只是个时间问题。
中国在人工智能领域上也出现了不少的优秀科学家,像是上文提到的李飞飞,她是美国斯坦福大学红杉讲席教授,美国国家工程院院士,也是斯坦福大学 “以人为本”人工智能研究院(HAI)院长。生于1976年的她,在发表计算机视觉殿堂级论文时才刚刚30岁。
还有申省梅,深度学习领域的专家。她是新加坡研究院院长,也是前松下新加坡研究院副院长。在美国国家技术标准局(NIST)主办的非受限条件下人脸识别竞赛 IJB-A 获得了人脸验证与人脸辨认的双项冠军。
除了这些计算机领域的翘楚,我国女性科学家在其他各大领域也在贡献着无与伦比的科研成果。1972年,40余岁的屠呦呦在实验中取到了一种分子式为 C15H22O5的无色结晶体,一种熔点为156℃~157℃的活性成份,这便是让她获得诺贝尔生理医学奖的青蒿素,可以有效降低疟疾患者的死亡率。这种药物的诞生,更是让国际天文联合会小行星中心将一颗小行星命名为屠呦呦星。
学术机构分布
具体到各大机构,谷歌和微软都有10名女性学者入围,麻省理工学院有9位,紧列其后。其他前10的学术机构包括华盛顿大学、脸书、斯坦福大学、加州大学伯克利分校、卡内基梅隆大学、清华大学和因特尔公司。
在女性学者比例方面,虽然谷歌和微软均有10名女性学者入围,谷歌的顶级女性学者占比仅为6.2%,低于9.8% 的国际平均水平,且远低于微软的12.3%。
而麻省理工学院和华盛顿大学入围学者中女性比例都接近国际基准线的2倍,达到18% 以上。清华大学顶级学者中的女性比例则为12.5%,高于斯坦福大学的10.5%,加州大学伯克利分校和卡内基梅隆大学的7%。
领域分布
AI 2000最具影响力学者共包含20个领域,每个领域100位学者,各领域的男女学者比例分布如下图。
其中女性学者最多的两个领域为人机交互和可视化,比例分别达到26% 和17%;第三则由自然语言处理、知识工程和安全与隐私共同分享,都达到了12%;第四名的领域包括数据挖掘、计算机网络和计算理论,比例为10%,略高于国际平均比例;其他领域则都低于国际基准线,其中机器学习领域顶级学者中的女性学者比例最少,只有2%,其次为数据库和语音识别,都为4%。
科研产出趋势
AI 2000人工智能全球最具影响力学者共包含179位女性学者和1654位男性学者,统计出不同性别在各个年龄段学者人数的比例,由此可以分析女性学者,学术成就与年龄之间的相关性,具体结果请见下图(x 轴代表学者的年龄)。
整体上,女性学者占比为9.7%,年龄在0-40岁的女性学者比例低于整体水平,而年龄在41-50岁的女性学者比例圴高于整体水平(56-60岁除外)。对于65岁以上的学者,男性学者占比明显高于其平均比例,即女性学者远低于其平均值9.7%。
另外,通过对每篇论文发表时学者的年龄进行统计分析,进一步了解顶级学者在不同年龄段的学术产出效率。通过下图的可视化展示(x 轴表示论文发表时作者的年龄),可以清晰地发现男女学者的学术产出效率随年龄增长都会逐渐升高,且都在46-50岁期间达到顶峰。
在16-25岁的年龄段,即学术生涯起步阶段,女性学者和男性学者的产出效率基本相同,但是在26-50岁间,男性学者的平均论文发表数量一直高于女性学者。在50岁之后的年龄段,男性和女性学者的学术效率基本恢复相同水平,且都稳定而持续地维持在顶峰水平。
研究兴趣
对 AI 2000学者的论文进行关键词抽取,分别得到179位女性学者和1654位男性学者的研究兴趣,并单独绘制成词云展示如下。
其中 AI 2000女性学者的研究兴趣主要分布在社交网络、数据挖掘、信息检索、设计、可视化和社交媒体等。与此对应,男性学者的研究兴趣则主要分布在机器学习、特征抽取、人工智能、数据挖掘和计算机视觉等。基本与学者分布中的男女学者领域分布结果吻合。
一直以来,女性科学家都是一支不容忽视的力量,她们需要被关爱和呵护,然而她们迫切想要得到的不是什么特权,而是一种平等。
时至今日,我们依然能够看到,一些老旧保守的思想仍在阻碍更多女性科学家前行的步伐。真正平等、和谐、美好的社会,不应该只停留在愿望清单里,而是应该在我们手中共同努力实现。
最后,祝天下所有女性节日快乐!愿你们青春永驻,享受岁月年华。
附:
人工智能全球女性榜单(Women in AI)全部179位女性学者,如下 ——