美图升级奇想大模型 强调与产品深度融合

风君子博客6月12日,美图公司举办以“聊聊AI工作流”为主题的第三届美图影像节,现场发布6款产品:美图云修V2;开拍V2;美图设计室V3;站酷设计服务;奇觅;MOKI,覆盖商业摄影、口播视频、电商设计、设计服务、游戏营销、视频生成领域。

现场,美图公司创始人、董事长兼首席执行官吴欣鸿宣布,美图奇想大模型(MiracleVision)已升级到V5,采用美图自研DiT技术架构,涵盖图像大模型、视频大模型、音频大模型和文本大模型,拥有更好的扩展性与更大的参数量,在语义理解、画面稳定性、动态连续性、主体一致性、内容可控性以及生成时长等方面,获得全方位提升。

对此,吴欣鸿在接受Techweb记者采访时进一步表示:“作为一家以美为核心的公司,我们对效果有着极高的要求。只有自研视频大模型,才能以高标准不断提升效果。同时,只有将模型与产品深度融合,做到模型即产品,才能给用户最好的体验。”

同时,现场共发布6款产品:美图云修V2;开拍V2;美图设计室V3;站酷设计服务;奇觅;MOKI,覆盖商业摄影、口播视频、电商设计、设计服务、游戏营销、视频生成领域。

吴欣鸿还提到,美图公司全球VIP会员数创下历史新高,截至6月11日,美图全球VIP会员数为1063万。

6款产品发布,打造AI工作流

据工信部测算数据,2023年我国生成式AI的市场规模约为14.4万亿元;同时,预计到2035年将突破30万亿元,在全球总市场规模中占比超过35%,成为全球AI产业链的重要一环。

参与到这场竞争中的美图公司,选择了更为聚焦的道路,专注于AI工作流的深度开发和创新。吴欣鸿介绍说,相比传统工作流,AI工作流具备五大优势:云+端的算力融合、一个人就是一支团队、轻松选创意、工作流可任意规划、基于数据模型自迭代。

美图在6月12日发布的6款产品,为影像与设计行业带来全新工作流:美图云修V2升级了AI批量精修和AI批量调色能力,进一步帮助商业摄影客户大幅提效;开拍V2升级了AI脚本、AI数字人、视频翻译、一键包装能力,解决口播视频创作者的策划、制作、变现等难题;美图设计室V3升级了AI批量化能力和AI商品视频创作能力,并支持团队多人协作,大幅提升电商物料设计产能;站酷推出找人高效、流程简单、售后放心的设计服务平台,连接广大设计需求者和千万级专业设计师;奇觅融合了美图的AI影像技术与睿晟的游戏营销经验,为游戏营销行业提供广告的高效制作与精准投放;MOKI聚焦AI短片创作,辅助创作者打造动画短片、网文短剧、故事绘本和MV,让视频创作简单高效。

6款产品的发布进一步完善美图的AI产品生态。目前,美图的应用层有AI图像、AI视频、AI设计、AI营销四大模块,生态层由中国领先的视觉创意平台站酷和美图AI助手RoboNeo提供服务,模型层由美图奇想大模型(MiracleVision)为全系产品提供AI模型能力。

视频大模型的落地应用:AI 短片工作流

今年2月,OpenAI发布文生视频模型Sora,并引发文生视频领域的激烈竞争。但美图在实践过程中发现,用类似的文生视频模型辅助内容创作,故事成片难,可控性较差。

美图通过一个AI短片工作流解决了上述难题:在脚本、视觉风格、角色等前期设定完成后,AI自动生成分镜图并转为视频素材,通过智能剪辑、AI配乐、AI音效、自动字幕等功能串联素材并实现成片。这个能落地的AI视频产品,就是AI短片创作工具MOKI。与常规文生视频产品不同,MOKI深度理解视频创作者需求,实现内容和成本的双重可控,目前可以进行多种视频场景的AI短片创作。

吴欣鸿表示,随着AI大模型的发展,AI应用将经历点、线、面三个阶段。美图正在把AI单点功能串联成AI工作流,可帮助电商、广告、游戏、影视、动漫等行业进一步提高生产力。 

大模型行业研究人士表示,中国发展大模型的关键是抓住场景红利,目前国产大模型的能力在垂直领域已经够用,最大的机会是将大模型向产业化、行业化、垂直化,深度定制方向发展。

美图持续布局AI应用 探索深层价值 

随着AI能力边界的不断延伸,各行各业也在期待AI改变传统的生产模式,带来革命性的效率提升。

过去两届美图影像节,美图发布的AI产品已得到用户和市场的认可,多次登顶日本、韩国、泰国、越南等国App Store总榜第一。此外,美图设计室全年收入过亿,Wink是视频工具赛道第二名,美图证件照是在线证件照赛道第一名,开拍是口播创作工具赛道第一名。

为持续推动AI应用落地实践,第三届美图影像节现场,开拍宣布推出“开拍AI助农计划”,提供三农主题的AI脚本和素材,辅导新农人拍摄和制作视频,以AI技术助力农村经济发展。美图设计室则推出“小微电商AI助力计划”,围绕义乌、广州、泉州等电商集中城市,助力电商个体创业者“一个人就是一支团队”,后续还将启动“电商AI设计课程”,帮助电商用户提升AI设计技能和订单转化。

“美图是一家成立16年,DNA里刻着对产品的热爱,并始终保持创业心态的公司。”吴欣鸿表示,面对正在发生的技术与商业变革,美图将通过实践不断探索落地场景,深耕AI应用,为用户和客户打造更好的AI工作流,让每个人都能享受到AI的价值。

长期关注美图的AI分析师表示,美图AI工具上新节奏加速,大模型迭代演化有望进一步推动AI功能落地。自2022年“AI绘画”开始,美图将生成式AI逐步落地在AI功能层面,如今打造AI工作流,或代表着美图公司的核心AI商业逻辑:从用户需求导向出发,探索AI技术演化和工作效率提升。第三届美图影像节发布的产品,表明美图公司过去对于用户核心需求的洞察能力在AI时代快速被释放,美图公司有望通过打造AI工作流,助力更多行业实现降本提效。(Suky)

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注