Google生成式AI新进展:推出新LaMDA语言工具 Wordcraft

风君子博客11月3日消息,Google在2日举办的年度AI活动中集中介绍了Google AI目前取得的成果,以及在解决人类挑战方面的创新,重点包括Google AI目前在3个变革性领域取得了突出成果。

这些新成果包括Google 用AI技术,预测洪水和野火、提升人类的健康等解决人类面临的挑战;Google 再次扩充所支持语言,宣布“一千种语言计划”,将支持全球1000种最常用语言的模型;同时Google 集中展示生成式AI取得的进展,包括推出新的LaMDA语言工具 Wordcraft等,更好地帮助创作者提升创意能力。

用AI技术应对气候变化和健康挑战

Google使用改造后的卫星图像来训练AI模型,使其能识别和实时跟踪野火,从而帮助预测火势演变和蔓延趋势,帮助消防队和救援人员及时了解野火事件。Google介绍,目前这一野火追踪系统已在美国、加拿大、墨西哥和澳大利亚的部分地区推出,自7月以来,报道了美国和加拿大的30多起大型野火事件,在Google Search和Maps中触达超700多万次展示,有效帮助用户和消防人员了解了火势情况。

2021年,Google AI洪水预测系统通过Google Search和Maps向2300万人发送了1.15亿条洪水警报通知,让无数生命免遭洪灾。Google还宣布在全球范围内推出新的模型Google Flood Hub,该模型在Google Search和Maps上线,通过显示洪水可能发生的时间和地点,来帮助更多的人在洪灾侵袭时转移到安全地点。

Google的自动视网膜疾病评估工具(ARDA)已经在印度、泰国、德国、美国和英国等国家部署使用和前瞻性研究中,成功筛查了超过15万名患者,其中一半以上发生在2022年,Google透露之后还将继续这一合作项目。此外,Google Health 团队目前正积极探索如何使用AI让用户通过手机就能检测呼吸和心率。

AI模型赋能创作者和艺术家

在生成式AI方面,Imagen和Parti由Google研发、在质量方面领先业内的两款图像生成模型。Imagen是视频序列的扩散模型;Phenaki则是为文本提示序列,可以生成长且连贯视频的模型。这两款模型的研发团体一直在合作使用这两种模型制作视频,在Google AI@的的活动上,Google首次分享了由AI技术生成的超分辨率视频。接下来,Google将把这一技术带到AI Test Kitchen(一个为人们提供了解、体验和反馈新兴AI技术的渠道)。在第二代AI Test Kitchen中,用户能使用 “城市梦想家(City Dreamer) “建造主题城市,用 “Wobble”设计能够移动、跳舞和跳跃的友好怪物角色。所有这些都能通过文本提示(text prompts)来实现。

二维图像外,文字转3D现在也已经成为现实。Google的DreamFusion可以生成一个能从任何角度观看,并合成到任何三维环境中的三维模型。音频生成领域,Google AudioLM模型仅通过聆听音频样本就能学习生成逼真语音和钢琴音乐,并预测在音频提示几秒钟后应该有哪些声音。通过与使用Wordcraft的作家们合作,Google测试了由AI驱动的,建立在Google最先进对话系统LaMDA上的文本生成系统。“当我们开发这些工具时,我们与全球的创作者群体合作。用户现在就可以在Wordcraft作家研讨会上阅读到这些故事的第一卷”Jeff Dean表示。

一千种语言计划

语言,是人们与技术互动的最自然的方式,然而,随着传统的语言训练模型方法不再适应全球交流方式的多样性,大量的语言无法在互联网上得到良好体现,为全球信息互联互通造成了巨大阻碍。为了解决这一难题,Google宣布了“一千种语言计划”,该计划承诺去构建一个可支持1000种最常用语言的AI模型,为世界各地边缘化社区的数十亿人带去更大的包容性。

作为该计划的一部分,Google目前开发了一个支持超400种语言的通用语音模型USM),据了解,这是迄今为止覆盖范围最大的语音模型。同时,随着项目扩展,Google与世界各地的社区合作,以获取有代表性的语音数据。通过与非洲的研究人员和组织密切合作,Google近期宣布在Gboard上为另外9种非洲语言输入语音,以创建和发布数据。在南亚,Google携手当地政府、非政府组织和学术机构,成功收集了来自所有地区方言和语言中有代表性的音频样本。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注