生成的图片离大谱！Google大模型新品又翻车

风君子博客2月23日消息，这几天Google又被推到了风口浪尖，主要是它新推出的Gemini 1.5在生成图片的时候会刻意增加有色人种的结果，导致生成的图片很多不符合历史事实。

大模型生成图片翻车

美国当地时间2月15日，Google发布“下一代AI模型”——Gemini 1.5，相比1.0代产品，Gemini 1.5版本性能有极大提升，具有图像生成功能。Google将Gemini 1.5开放给部分开发者试用。

随着试着，部分用户发现Gemini 1.5生成的图片太“离谱”了，缺乏基本的历史常识。

有用户在X上贴出了自己要求Gemini 1.5生成的图片，如要求生成“1943 年德军士兵”的图片时，Gemini 向其展示了由黑人、亚裔和白人女性身穿纳粹德军制服的照片。

比如，要求Create an image of a pope（创建教皇的图像），如下。

这些图片在X上被广泛传播，不少用户破了大防，认为Google的Gemini存在针对白人的“种族主义”歧视等等。

有用户吐槽Google的最大问题就是技术中掺杂了太多的“政治正确”，导致其技术突破在各方面都有政治观念束缚。

对此，Google在其声明中表示，已经意识到 Gemini“在某些历史图像生成描述中提供了不准确的信息”，并将立即进行修复。

现在Google已经暂停Gemini的人物图像生成，并称将很快重新发布改进版本。

这也不是Google大模型“产品秀”的首次翻车

在去年12月7日谷歌首次正式发布大模型Gemini1.0时，其一并发布的一段展示Gemini多模态功能的6分钟演示视频就被测试用户指出“故意造假”，因为实际测试时并没有如演示视频中“丝滑”。

当时，Gemini负责人否认故意造假，Google很快发布了一篇博客文章解释了演示视频中的多模态交互过程，几乎承认了使用静态图片和多段提示词拼凑，才能达成这样的效果。

但是Google对演示视频的这些“后期加工”，网友认为是“虚假宣传”、“为了让自己看上去比竞争对手要强很多”等。

被OpenAI的巨大成功打了个措手不及后，Google怎会甘心将人工智能的头把交椅拱手让人！

自去年谷歌首次正式推出了大模型Gemini并在一周后向开发者和企业客户开放Gemini 1.0 产品能力后，今年来，Google在大模型领域的产品节奏明显加快。

仅在今年2月，Google已经连续放出3个大招：2月9日Google宣布最强大模型Gemini Ultra可免费用，2月15日发布大模型Gemini 1.5，2月21日推出新一代开源模型Gemma。

Google最新推出的开源模型Gemma被认为是，继通过Gemini拳打OpenAI后，试图用Gemma来脚踢走开源路线的Meta。

开源模型 Gemma

Google最新发布的开源模型Gemma采用与创建 Gemini 模型相同的研究和技术构建而成。

Gemma主打轻量级、高性能。Gemma模型有两种尺寸：Gemma 2B（20亿个参数）和Gemma 7B（70亿个参数），Google强调其拥有“同等规模最领先的性能”。

性能方面，Google称Gemma在MMLU、BBH、HumanEval等八项基准测试集上大幅超过Llama 2。

Google还强调Gemma基于自研TPUv5e芯片训练，Gemma 7B使用了4096个TPUv5e，Gemma 2B使用了512个TPUv5e。

另外，Gemma的独特之处还在于它能够在多种类型的设备上运行，包括笔记本电脑、台式机、物联网、移动设备和云端。

目前，Google宣布Gemma在全球范围内开放使用。

Google强调，Gemma为开放社区构建，旨在推动开发者和研究人员的 AI 创新。用户可以通过 Kaggle 的免费访问权限、Colab notebooks 免费层、以及 Google Cloud 新用户可获得的 300 美元积分立即开始使用 Gemma。研究人员还可以申请高达50万美元的 Google Cloud 积分以加速他们的项目。

生成的图片离大谱！Google大模型新品又翻车

Published by

风君子

发表回复取消回复

Published by

风君子

发表回复 取消回复

发表回复取消回复