风君子博客“百模大战”正酣,蚂蚁集团选择从自己最擅长的金融领域加入战局。
9月8日,蚂蚁集团正式发布金融大模型。据了解,蚂蚁金融大模型基于蚂蚁自研基础大模型,针对金融产业深度定制,底层算力集群达到万卡规模,聚焦真实的金融场景需求。
蚂蚁集团副总裁、金融大模型负责人王晓航向TechWeb等表示,大模型正在为金融产业带来体验变革,“金融业务链条上每一个关键职能,都值得用大模型技术重做一次。”
目前,蚂蚁金融大模型已在蚂蚁集团的财富、保险平台上全面测试。基于金融大模型能力的两款产品也在内测中,将在完成相关备案工作后上线。
“在金融这样一个严谨的领域,工业级的产品很少。我们今天发布的是产业大模型,希望能解决产业问题,做这一轮科技竞争过程中的一股务实和专业的清流。”王晓航说到。
主打实用
今年6月,有消息称,蚂蚁集团技术研发团队正在自研语言和多模态大模型。当时蚂蚁回应称“情况属实”。如今,蚂蚁大模型第一步公开卷向金融,是奔着规模化产业应用去的,主打就是实用。
据蚂蚁集团首席技术官、平台技术事业群总裁何征宇透露,早在去年9月内部的一个战略性会议上,团队就确定了AI必须围绕大模型来做整体升级。而且,团队认为大模型必须要和产业落地相结合。
深耕金融行业多年,蚂蚁做金融大模型有其独特优势。从算力上来看,蚂蚁金融大模型基于蚂蚁基础大模型,针对金融产业深度定制。据介绍,蚂蚁基础大模型平台具备万卡异构集群。
知识力上,蚂蚁金融大模型在万亿量级Token的通用语料基础上,注入千亿量级Token金融知识,并从300+真实产业场景中提取了共60万+高质量指令数据,形成了金融专属任务性能优化的优势数据资产。
此外,蚂蚁金融大模型可通过理解用户语言,精准调用蚂蚁体系内多种数字化金融工具,理财侧包括理财选品、产品评测、行情解读、资产配置等6大类服务,保险侧包括产品解读、家庭配置、智能核保、智能理赔等10多个智能服务。
据王晓航介绍,基于金融场景中的大量实践,蚂蚁金融大模型形成了“大模型+知识+服务”驱动的架构,这套架构已经在蚂蚁内部金融智能化场景上内测。
如何防止大模型出现“幻觉”
受限于训练数据中存在的偏见和误导性信息,大模型在人机对话中可能会产生不准确或不合理的回答,人们形象地将其比喻为“大模型幻觉”。
但在金融这样一个严谨的领域,金融大模型要确保领域知识和专业逻辑的严谨性以及内容生成的可控性,才能真正落地带来产业价值。这也是金融大模型要解的产业真命题。
王晓航在接受采访时坦言,金融对知识专业性、逻辑的严谨性,以及合规性都要求很高。原生大模型距离金融行业的要求还有很大的鸿沟,如何防止大模型出现幻觉,并没有很好的办法。
“为此,我们采用了知识图谱的结构化数据,与大模型参数化数据相结合双驱动方式。希望通过积累的大规模金融领域的知识图谱,能确保大模型的专业和严谨性。”王晓航说到,通过知识的注入、一致性的对齐,在生成完后,对真实和一致性进行判别,这是一个系统化的过程。
王晓航认为,现在金融行业本身还没有成熟到可以全面驾驭大模型所带来的机会。“这需要金融科技公司,包括金融体系内部的科技力量,能够把技术转化成产品、转化成平台。我觉得这还需要大概1、2年的时间。”
落地产品正在内测中
“我们还是希望大模型可以为金融产业带来一些替代性的体验。”王晓航如此表示。支小宝2.0和支小助正是蚂蚁集团正在内测的基于金融大模型开发的应用产品。
其中,支小宝是一款智能理财AI,在蚂蚁内部代号为“安娜”,从2018年就开始启动立项。同年,ChatGPT最早的版本GPT1.0也开始研发。如今接入大模型后,金融知识数据存储量已经达到百亿级。
在现场演示中,有用户咨询“人工智能这么火,会影响哪些行业”,支小宝2.0会基于专业机构和权威媒体等提供的千万份报告与资讯库,整合提炼后进行回答。当用户问“现在能买点吗”,支小宝2.0会调用持仓诊断、配置分析等多个工具,循序渐进地分析人工智能板块当前行情,结合用户持仓状况引导合理配置,提示该用户降低仓位,避免追涨杀跌的非理性行为。
用户进一步追问“还是看不懂”时,支小宝2.0会再换一换表述,先解释“行业卫星基金”这个专业名词的意思,再解释这类资产不能过多的原因,是希望能分散风险、平衡收益。
除了更智能之外,支小宝技术负责人陆鑫介绍说,依托语言力的提升,支小宝2.0的情商也在提高,金融意图识别准确率达到95%,能够理解用户情绪,主动进行多回合的高质量对话,甚至调整成更专业或更通俗的沟通风格。在回答用户提问后,大模型下的支小宝还会自动“反思”回答准确度,进行自我纠偏。
此前的数据显示,截至2022年,支小宝1.0版本(检索式AI)已经累计服务用户超过3亿,解答了超过17亿个理财问题。
与面向C端的支小宝不同,支小助是一款面向B端金融行业专家的智能业务助手,可在投研分析、信息提取、专业创作、商机洞察、金融工具使用等环节提供深度智能服务。
以“投研支小助”为例,实测数据显示,支小助每日可辅助每位投研分析师高质量地完成超过100+篇研报和资讯的金融逻辑和观点提取,40+金融事件的推理和归因,分析效率倍增。同时,支小助可基本替代基础的金融工程代码编写,带来量化研究效率的大幅提升。在“服务支小助”的辅助下,理财顾问和保险代理人的有效管户半径人均可扩大70%以上。
据透露,支小宝2.0已经内测近半年,待完成备案工作即可上线。支小助则正与蚂蚁平台的合作机构内测共建,待成熟后向蚂蚁平台上的合作机构正式开放。
商业化还需要时间
在外滩大会上,蚂蚁集团面向金融行业披露了蚂蚁金融大模型“1+1+2”矩阵:一个金融大模型,一个Fin-Eval金融AI任务评测集,个人金融助理支小宝2.0和专家业务助理支小助。
Fin-Eval代表真实产业场景需求,是目前覆盖最广、专业性最深的金融智能领域评测集。据王晓航介绍,蚂蚁集团已经正式对外开放Fin-Eval,希望促进行业技术共同进步。
“我们对技术开放的态度一直以来都是成熟一个就开放一个。”王晓航介绍说,“当蚂蚁金融大模型的生产力应用更加成熟的时候,我们会向行业进行更开放、更大规模、更大范围的推广。”
谈及蚂蚁金融大模型的未来商业模式,何征宇在采访中表示,AI大模型现在还非常早期,今天没有办法非常明确地讨论商业化,一方面技术还处于“婴儿期”,另一方面也需要时间。
何征宇认为,产品和软件的付费是一种商业模式,例如妙鸭相机等AIGC产品的商业化尝试,包括word等用软件方式去交付的产品,都可能为大模型商业化提供借鉴。当下最大的问题是如何准确地度量和反馈大模型带来的价值,这是大家需要思考的东西。
据悉,蚂蚁集团未来将持续探索和精进大模型的五大能力方向。一是,建设高质量的数据标注团队,沉淀高质量数据体系;二是,攻坚基础大模型算法,以及高效绿色工程能力,提升模型逻辑推理等能力;三是,从通用语言大模型到通用多模态大模型,从一般通识走向全面专业;四是,建设高效的大模型评测标准和评测体系,加快大模型迭代速度;五是,建设大模型安全能力,保障大模型健康可持续发展。