国产大模型,应该避免走入加拉帕戈斯时刻

在中国,大模型技术进化加速度的同时,淘汰也加速度。

短短两年时间:大模型的战争,就从 GPT 一马当先,到国产大模型百模大战,再到行业格局固定,只剩大模型五虎和几个互联网大厂。

在此期间,伴随模型大小一同膨胀的,则是算力、人才、电力、数据中心无数基础资源的不断加码。于是,全球范围内,英伟达的股价一路披荆斩棘,一年暴涨 7 倍,市值超越苹果;各大机构大模型团队,从研究员到助理,从教授到学生,接到的猎头电话,频率甚至超过了来自移动联通的套餐升级问候……

然而,参数的加码是无限的,资源是有限的,热潮当中,长期无限制的基础模型竞赛,真的是一个正确的方向吗?

宏观经济中,作为借鉴过河的对象,日本早已成为全球范围内一块被摸圆的石头:尤其在商业社会,昭和年代之后,围绕日本为什么失去半导体、家电、电池等行业,一种名为「日本产业反思体」的文章迅速在全球走红,其受众群体之广泛,堪比企业家版《意林》。

对于历史的错过,有人将原因归咎于资本,有人将原因归咎于时代变化,但这始终解释不了为什么在电视、电脑、芯片、面板、互联网、电池这些截然不同的产业里,日本贡献了最多的诺贝尔奖,但在商业中,却总是陷入相似的加拉帕戈斯陷阱:

所谓加拉帕戈斯陷阱,指的是加拉帕戈斯群岛由于千万年来与世隔绝,产生了与大陆极为不同的稳定生态系统,可一旦面对来自外来物种入侵,就面临被淘汰的危险。

而在日本的商业社会中,日本电装最早在 1994 年发明二维码,结果发扬光大的却是中国的微信、支付宝;20 世纪日本人做出了全球保质期最久、最优秀的存储芯片,全世界却在韩国人的带领下爱上了良率不高却足够便宜的三星存储;再后来,新能源时代,日本人一步到位发展起了最清洁的燃料电池,但新能源汽车却在特斯拉的带领下,集体奔赴锂电池的星辰大海。

为什么明明技术遥遥领先,商业化却仍旧颗粒无收?

这个困扰日本产业发展几十年的问题,如今也值得被中国的大模型产业重视起来。

01

如何避免 AI 走入

加拉帕戈斯困境?

以百度创始人李彦宏为代表,中国的大模型产业,正逐渐建立起一个新的共识:

正如同日本的诺贝尔奖数量并不直接决定其产业的强势与否,对于 AI 产业,只卷基础大模型,或许会是一段时间里,行业最大的失误。

一个最直接的原因就是,当所有资源全部被押注在基础大模型的研发上时,直接带来的,或许不是技术的突飞猛进,而是相同成果一遍遍的复现,反而带来算力与研发资源的极大浪费。

就拿算力来说,一般来说,训练大模型的显卡标准配置为 A100 与 H100。当前,一张 A100 售价大约 8 万人民币,一张 H100 大约 15 万人民币;而将他们组装成服务器,一个 8 卡的 A100 服务器大约 130 万人民币,装配了 8 张 H100 显卡的服务器价格大约 200 万元。

当然,这些全都有价无市。

而将其对应到模型侧,训练一个千亿模型,大约需要用 1PB 数据,如果在 10 天内完成,需要至少一万张 A100,对应购买服务器的起步费用,就是 17 亿。

此外,据报道,OpenAI 训练 GPT-5 需要数万张英伟达 H100 芯片,也就是说,相应的服务器成本,将达到 30 亿人民币上下,如果再算上数据中心成本、人力成本、电力成本,以及无数次推到重来的可能,需要的成本,几乎相当于国内头部大模型独角兽的融资总额之多。

相应的,随着参数量的进一步暴增,基础大模型将注定成为少数玩家的游戏。

参数量与玩家数量的成反比之外,创投市场的悲观,宏观经济的不确定,则又为这场基础大模型的豪赌,添上了一抹不确定的色彩。

大模型研发要钱,而在没有确定的营收之前,创投是核心的现金来源。但创投数据库 IT 桔子的数据显示,近两年来,无论 AI 的融资规模还是数量,相比 2017 年前后的 CV 热潮,都大有不足。但研发成本上,大模型却是上个时代 CV 的数倍之多。

于是,AI 行业一个怪圈出现了:早期,每当 Open AI 有新版本的大模型发布时,过不了三个月,国内一大批企业,就会引用第三方数据于开源数据集跑分,开始不断论证自家模型对各个版本 GPT 实现超越。

在这背后,为了迎合打榜需求,over-fitting(过拟合)也成为一个 AI 圈特有的现象,由于训练过程中,模型对某一或者某几个打榜用的开源数据集拟合过于精细,以至于模型记住了不少开源数据集特有的噪声,从而打榜分数居高不下,但实际应用中,效果却往往却一言难尽。

用李彦宏的话来说,「百模大战」让我们建立起了追赶世界最先进玩家的能力,但当前业界过分关注模型本身,造成了巨大算力浪费,忽视了 AI 真正的价值所在——应用。

02

降低创新的

成本意味着什么?

如果只卷基础大模型是一条错路,那正确的方向在哪里?

研究了无数日本的产业兴衰之后,曾有专家总结,日本企业最大的问题,从来不是在于点错科技树,而是因为技术遥遥领先之后,没有带动更多玩家参与,让整个产业链的成本一同降低,从而成为加拉帕戈斯群岛中独自演化的「怪物」。

比如,互联网发明,万维网是一切的基础,但真正带领产业蓬勃发展的,则需要搜索、电商、短视频等万亿级下游应用。

大模型同理:少数玩家高端竞技之外,如何让大模型吸引更多生态玩家一同参与扩充应用市场,或许是这场旷日持久的大模型战争中最关键的赛点。

如何解决这一问题,在不久前的世界人工智能大会上李彦宏明确指出了百度的思路:智能体代表着 AI 时代的未来趋势,由于它门槛足够低,可以「让更多人进来。在此之后,整个社会的创新,就会像 90 年代中期时候的互联网网站,诞生数以百万计的网站大浪淘沙之后,指不定哪条路就跑通了,从而诞生 Google、Facebook 这样的 Super APP。

近十年,百度 AI 相关的研发投入超 1400 亿元,基于以上投入,百度同时也是全球为数不多的、有着应用、模型、框架、芯片四层全栈布局的 AI 公司,其文心大模型的日均调用量更是已经突破 6 亿次。以此为基础,百度还先后上线知识库、插件、自动追问、长期记忆、多尺寸模型,来完善智能体的生态。

目前,通过百度智能体,创建 AI 原生应用的开发将变得像拍短视频一样简单,甚至一句话就能创建智能体。哪怕一些复杂的智能体创建需求,用户也能像搭乐高一样,灵活调用、组合各种工具。

图片文心智能体平台截图

这种极低的创新成本,换来的是汹涌而来的生态玩家:截止目前,百度文心智能体平台吸引了 10 万家企业、60 万名开发者,覆盖了上百个应用场景。

比如主业是做教育培训的上海英孚教育,通过智能体打造了用户的专属英语顾问,不仅能「因材施教」为咨询客户推荐课程、外教,还能根据用户地址、需求,提供就近的培训地点,让企业的线索有效率大幅提升。

当然,降低门槛只是产业做大重要一环,但更重要的是,降低门槛之后,如何创造营收,让雪球越滚越大,让创新成为一个稳定自循环的生态。

03

为什么超级市场,

才是大模型生态的最后一环

日本为什么总在发明,又总是在错过?

曾有学者复盘,很多技术,日本人发明之后,往往被中国人与美国人接手,才正式发展壮大,比如宁德时代的很多技术脱身于日本的 ATL,二维码在日本发展二十年,不如中国一场移动支付带来的普及效果。

技术创新到形成产业,中间的催化剂是超级市场。只有超级市场,才能让所有的参与者赚到钱,也只有赚到钱,才能越过技术一时的领先与否,决定技术长期的生命力。

围绕这一目标,百度逐步打造了涵盖智能体开发、分发、再到变现解决方案的全新生态。

「目前百度已跑通了智能体生态的闭环,不仅人人可用,还能人人可开发、人人可分发、人人可获益」。9 月 12 日,百度集团资深副总裁、百度移动生态事业群组总经理何俊杰在 2024 年百度联盟大会上表示。

在分发环节,百度构建起了「1+N」的流量分发生态。这里面,「1」代表搜索消费场景内的分发,「N」则是在多终端场景的覆盖,开发者仅需一次开发,就能在百度搜索及文小言、小度、贴吧、网盘等百度的多样化、多终端场景的终端生态中进行智能体部署分发。

其中,以百度搜索是天然智能体分发池,当前,百度搜索每天请求量几十亿次,其中很多需求都可以被智能体满足。比如,百度针对高考开发的高考智能体「AI 志愿助手」,通过智能分析,能为考生量身定制志愿方案。高峰时每天有超 320 万考生通过百度高考页面,直接搜索「高考 xx 分能上什么大学」,或进入「AI 志愿助手」获得针对性的分析和决策参考。

在变现环节,百度正逐渐把智能体引入到百度联盟这个大生态,持续为联盟伙伴提供商业化价值。

过去,PC 时代,百度联盟结合百度搜索,一度抢占了绝大部份线上广告份额;移动互联网时代,百度联盟则结合百度 APP、贴吧、地图为核心的移动产品矩阵以及手机厂商等终端,进一步扩大线上广告的市场规模,并催生出「内容+广告」的新型商业模式。

根据官方数据,用户侧,百青藤 24 年 DAU 覆盖已超 8 亿、百青藤变现能力提升 30% 以上,通过不断提升系统承接能力,保证优质流量承接,百青藤入口请求量年同比提升 27%。商家侧,目前已有超 2 万个智能体使用了商业组件。截至 8 月底,每天有超 1.9 万家企业使用商家智能体,覆盖教育、房产、机械等 30 多个行业。

近日的百度联盟大会上,百度还全新推出智能体联盟解决方案,为企业带来新场景新流量,及新的变现机会。

其中,在变现环节,百青藤携手文心智能体平台,推出了创新变现解决方案,通过创新广告和服务直达广告,可以实现与文心智能体平台、智能体开发者之间的互利共赢局面。

此外,百度还推出了【分发+变现】一体化解决方案,通过「流量+能力」的双变现通路,实现智能体开发者、百青藤、联盟合作伙伴的三方共赢。

比如,用户点击播放《唐朝诡事录 2》后,下方关联内容会推送故事角色「裴喜君」的角色智能体,并以剧中热点问题巧妙地将观众引导至智能体交互界面。通过数轮深入交流,适时推送高度匹配的广告内容,进而实现内容与商业的无缝融合。

再比如中国供应商网,在接入百度智能体变现插件后,智能体能够精准地把握买家采购意向,积极高效地和平台买家沟通,并深度挖掘采购细节,比起原有的表单提交系统,信息完善率提升 87%,转化率提升 31%。再加上智能体后台的个性化配置,中国供应商网还可以根据自身需求不断调整优化,挖掘和满足 AI 时代更多的用户诉求。

而在高三网,用户则可以借助智能体组件,通过智能引导与关键词提问,探索并查阅到更为广泛且相关的内容,这让高三网的资讯内容矩阵对于用户搜索的目标信息能给出更多元的解答,为用户提供了快捷、高效的搜索体验。商业化层面,智能体在短短一周内就实现落地上线,相较于传统广告,为高三网带来的整体收益提升数倍。

至此,技术为根基,智能体为手段,百度联盟带来广阔的应用空间,百度正式跑通了大模型从研发到落地的生态闭环。

04

尾声

做出全球领先的基础大模型,还是一句话创建智能体,用大模型变现?

两者相比,或许后者并不是一个如同奥特曼一样能站在世界聚光灯舞台上改变世界的炫酷行为,而是更像是商业社会中「低垂的果实」。

但事实上,只有通过百度智能体,让「人人可开发,人人可分发,人人可获益」,让整个行业上下游的开发者、联盟伙伴、厂商一同参与,一同受益,生态才会做大,大模型产业才能长久持续。

也只有在前行的路上,不断摘取「低垂的果实」,完成一个又一个从 0 到 1 的商业化落地,才是新兴产业从技术突破到真正落地,从 1 到 100 改变世界的必经之路。(Cythia)

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注