风君子博客9月4日消息,近日, Gartner 发布了《中国数据分析与人工智能技术成熟度曲线》,Gartner 在报告中提到“预计到 2026 年,中国超过 30% 的白领工作将被重新定义,使用生成式人工智能将成为一项广受欢迎的技能。”
今年是Gartner首次发布中国数据、分析和人工智能技术成熟度曲线。报告揭示了与中国数据、分析和人工智能相关的四个基本主题:业务成果优先的中国数据战略,区域数据与分析和人工智能生态系统,数据中台的崩塌,以及人工智能成为新的国力象征。
该曲线中,即将进入期望膨胀期的技术数量最多。Gartner高级研究总监张桐表示:“创新往往被吹捧为传统瓶颈问题的解决方案,有望解决中国CIO共同担忧的问题,如硬件资源短缺、可扩展性、可持续运营、安全风险缓解、技术自主可控和AI模型的多域适用性问题,从而带来清晰的业务价值。然而,终端用户更重视有形的影响,而不是抽象的战略概念。”
数据编织
数据编织是一种设计框架,用于获得灵活而且可复用的数据管道、服务和语义,涉及数据集成、主动元数据、知识图谱、数据剖析、机器学习和数据分类。数据编织颠覆了现有的数据管理主导方法,不再针对数据和用例“量身定制”,而是“先观察再使用”。
Gartner高级研究总监张桐表示:“数据、分析和AI用例的出现,以及快速变化的数据安全法规,导致了中国数据管理的复杂性和不确定性。数据编织能充分利用沉没成本,同时也能为数据管理基础设施方面的新支出提供优先级排序和成本控制指导。”
Gartner预计,数据编织作为一种新兴的数据管理框架,正是萌芽阶段,还需要10年时间被市场主流采用。
数据资产管理
数据资产管理是指管理、处理和利用对业务运营来说具有宝贵资产价值的数据的过程。数据资产管理适用于多种数据形态——例如,系统中的图像、视频、文件、资料和交易数据,并涵盖从数据获取到销毁的整个数据生命周期,目的是以管理资产的方式管理数据,并从中创造价值。
数据作为一种新的生产要素,已成为企业机构的竞争优势。数据具有快速、多样、大量和描述事实的特点,因此企业机构必须整合流程来生成数据洞察。
报告显示,数据资产管理是一种具有转型效益评级的创新,并可以在不到两年的时间内实现主流采用。在未来两到五年内,值得特别关注的技术包括公民数据科学、决策智能、生成式人工智能和实时数据管理。早期采用这些技术将带来显著的竞争优势,并减轻因缺乏业务技术人员而造成的问题,以及与获取业务环境和结果价值相关的挑战。
Gartner高级研究总监张桐表示:“数据资产不仅能提升运营质量和决策水平,更可以创造更多业务价值,还能够产生新的业务模式和利用数据直接变现。然而,尽管价值创造在加速,数据资产仍存在潜在风险。企业机构必须谨慎管理数据资产,避免监管违规和数据意外泄漏。”
组装式数据和分析
组装式数据和分析(D&A)利用基于容器或业务微服务的架构和数据编织理念,将现有资产组装为灵活、模块化和用户友好的数据分析和人工智能(AI)能力。这项技术可在低代码和无代码能供的支持下,综合运用一系列技术将数据管理和分析应用转变为数据分析和AI组件或其他应用模块,并且支持自适应和智能决策。
面对瞬息万变的业务环境,中国企业机构需要提高敏捷性,加快洞察产出速度。组装式D&A有助于企业机构使用模块化数据和分析能力,在各项措施中融合多个洞察与参考信息,避免割裂式开发。企业机构可通过组装或重组D&A能力进一步提高交付的灵活性,应对不同使用场景。
大模型
大模型是在大范围的数据集上以自监督方式训练的大参数模型,其中大多数都是基于Transformer架构或扩散型深度神经网络架构,并且在不久的将来可能会成为多模态。大模型这一名称是源于其对于多种下游使用场景的重要性和广泛的适配性。这种适应多种场景的能力得益于模型充分和广泛的预训练。
大模型现在已经成为了自然语言处理的首选架构,并已应用于计算机视觉、音视频处理、软件工程、化学、金融和法律领域。大模型衍生出的一个热门子概念就是基于文本训练的大语言模型。
Gartner高级研究总监张桐表示:“大模型有潜力为各类自然语言用例中的应用提供增强效果,因此将在垂直行业和业务职能中产生深远影响。它们可以提高员工生产力、实现客户体验自动化和增强,并能以经济高效的方式创建新产品和服务,从而加速数字化转型。”
“不过,大模型的门槛实际上是很高的,不是谁都能去做大模型。”张桐说到,“通过数据的体量、能够投入的资金、算力卡的数量等来看,我觉得中国超不过10家。”
此外,张桐建议,初创公司不应该在大模型的底层做,因为它们没有足够的预算和能力,可以去上面的应用层发力,上面的组件、功能化的小工具,如果初创公司去做的话有可能会实现比较大的突破,比如现在很火的“妙鸭”。
数据中台
数据中台(DMO)是一种组织战略和技术的实践。通过数据中台,不同业务线的用户能够依据单一事实源,高效地使用企业数据进行决策。创建数据中台可以被是为企业构建可组装和可复用地数据和分析能力地一种方式,这些能力可以提供独特地数字运营,并通过技术栈将数字运营贯穿到整条价值链中。
很多中国企业之所以采用数据中台实践,是为了减少其数据和分析架构的技术冗余,打通不同系统的数据孤岛,并推动可复用的数据和分析能力。但数据中台在许多情况下未能兑现其组装式敏捷D&A能力的承诺,因此在市场中的地位被削弱。许多企业机构和供应商都不愿意在企业内部采用这一概念,或者干脆将其从宣传中移除。