生成的图片离大谱!Google大模型新品又翻车

风君子博客2月23日消息,这几天Google又被推到了风口浪尖,主要是它新推出的Gemini 1.5在生成图片的时候会刻意增加有色人种的结果,导致生成的图片很多不符合历史事实。

大模型生成图片翻车

美国当地时间2月15日,Google发布“下一代AI模型”——Gemini 1.5,相比1.0代产品,Gemini 1.5版本性能有极大提升,具有图像生成功能。Google将Gemini 1.5开放给部分开发者试用。

随着试着,部分用户发现Gemini 1.5生成的图片太“离谱”了,缺乏基本的历史常识。

有用户在X上贴出了自己要求Gemini 1.5生成的图片,如要求生成“1943 年德军士兵”的图片时,Gemini 向其展示了由黑人、亚裔和白人女性身穿纳粹德军制服的照片。

比如,要求Create an image of a pope(创建教皇的图像),如下。

这些图片在X上被广泛传播,不少用户破了大防,认为Google的Gemini存在针对白人的“种族主义”歧视等等。

有用户吐槽Google的最大问题就是技术中掺杂了太多的“政治正确”,导致其技术突破在各方面都有政治观念束缚。

对此,Google在其声明中表示,已经意识到 Gemini“在某些历史图像生成描述中提供了不准确的信息”,并将立即进行修复。

现在Google已经暂停Gemini的人物图像生成,并称将很快重新发布改进版本。

这也不是Google大模型“产品秀”的首次翻车

在去年12月7日谷歌首次正式发布大模型Gemini1.0时,其一并发布的一段展示Gemini多模态功能的6分钟演示视频就被测试用户指出“故意造假”,因为实际测试时并没有如演示视频中“丝滑”。

当时,Gemini负责人否认故意造假,Google很快发布了一篇博客文章解释了演示视频中的多模态交互过程,几乎承认了使用静态图片和多段提示词拼凑,才能达成这样的效果。

但是Google对演示视频的这些“后期加工”,网友认为是“虚假宣传”、“为了让自己看上去比竞争对手要强很多”等。

被OpenAI的巨大成功打了个措手不及后,Google怎会甘心将人工智能的头把交椅拱手让人!

自去年谷歌首次正式推出了大模型Gemini并在一周后向开发者和企业客户开放Gemini 1.0 产品能力后,今年来,Google在大模型领域的产品节奏明显加快。

仅在今年2月,Google已经连续放出3个大招:2月9日Google宣布最强大模型Gemini Ultra可免费用,2月15日发布大模型Gemini 1.5,2月21日推出新一代开源模型Gemma。

Google最新推出的开源模型Gemma被认为是,继通过Gemini拳打OpenAI后,试图用Gemma来脚踢走开源路线的Meta。

开源模型 Gemma

Google最新发布的开源模型Gemma采用与创建 Gemini 模型相同的研究和技术构建而成。

Gemma主打轻量级、高性能。Gemma模型有两种尺寸:Gemma 2B(20亿个参数)和Gemma 7B(70亿个参数),Google强调其拥有“同等规模最领先的性能”。

性能方面,Google称Gemma在MMLU、BBH、HumanEval等八项基准测试集上大幅超过Llama 2。

Google还强调Gemma基于自研TPUv5e芯片训练,Gemma 7B使用了4096个TPUv5e,Gemma 2B使用了512个TPUv5e。

另外,Gemma的独特之处还在于它能够在多种类型的设备上运行,包括笔记本电脑、台式机、物联网、移动设备和云端。

目前,Google宣布Gemma在全球范围内开放使用。

Google强调,Gemma为开放社区构建,旨在推动开发者和研究人员的 AI 创新。用户可以通过 Kaggle 的免费访问权限、Colab notebooks 免费层、以及 Google Cloud 新用户可获得的 300 美元积分立即开始使用 Gemma。研究人员还可以申请高达50万美元的 Google Cloud 积分以加速他们的项目。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注