“东数西算”工程全面启动:26 座城市抢建智算中心,华为、曙光等成为中标赢家

近日,“东数西算”国家项目正式启动,为数据中心产业带来了重要利好信号。

作为数据中心中领域的一颗“明珠”,智算中心也引起行业关注。

一般认为,智算中心全称是人工智能计算中心,主要是为人工智能(AI)应用提供所需算力服务、数据服务和算法服务,由 AI 芯片和算力机组等设备组成,与云计算中心、超算中心有一定区别。企业和研究机构可以依托智算中心提供的强大算力,驱动 AI 模型进行数据深度加工,实现 AI 应用创新。

“东数西算”国家项目强调在京津冀、长三角、成渝等八大枢纽间建设算力网络,支持全国各地日益增长的算力需求。而沿着这张算力网络“地图”,我们发现智算中心已经“遍地开花”。

细数过来,从 2021 年到 2022 年开年,全国有不下 20 座城市建成或正在建智算中心,智算中心数量达到 27 个,而其中位于八大枢纽的就有 12 个,接近 50%。

▲“东数西算”工程国家算力枢纽节点范围内的智算中心

那么具体有哪些城市在建设或者规划建设智算中心?“东数西算”工程会对智算中心带来什么样的影响?各地智算中心项目建设进度如何?可能会对当地 AI 产业有何影响?

智东西通过调查 2021 年以来各地规划、建设和建成的智算中心,并与业内人士交流,来与大家一起探讨这些问题。

一、26 城开建智算中心,华为曙光等是赢家

据智东西统计,从 2021 年 1 月 1 日到 2022 年 2 月 15 日,全国共有至少 26 个城市在推动或刚刚完成当地智算中心的建设,这些城市中既有省会城市,例如南京、西安,也有非省会城市,像许昌、青岛。

其中,不少城市已经在本地建设了像大数据中心、云计算中心、国家超算中心等信息基础设施。不过这些中心并不能替代智算中心,它们之间的功能存在差异 —— 像云计算中心,主要是提供云服务,超算中心主要为科学研究提供超算服务,智算中心则主要是为企业和科研院所提供普惠 AI 算力服务。

此外,中信所《人工智能计算中心发展白皮书(2021)》中指出,智算中心借鉴了超级计算(高性能计算)中心和云计算数据中心大规模并行计算和数据处理的技术架构,但它是以 AI 专用芯片为计算算力底座的。上述三类中心的软件和业务架构不一样,不过云数据中心和超算中心也可以通过延展建设,来对外提供智能算力。

据我们统计,2021 年,全国建成并投入运营或试运营的智算中心有 8 个,分别是武汉人工智能计算中心、合肥先进计算中心、南京智能计算中心、中国电信京津冀大数据智能算力中心、浙江(长三角)新一代全功能智能超算中心、西安未来人工智能计算中心、中原人工智能计算中心、哈尔滨人工智能先进计算中心,投运时间分别是 5 月、6 月、7 月、8 月、9 月、9 月、10 月和 12 月。这些智算中心中大部分都有二期建设规划。

▲ 截至目前,2021 年和 2022 年各地投入运营的智算中心情况

一些智算中心并没有直接用“智算中心”或“人工智能计算中心”命名,而是采用“先进计算中心”或“智能超算中心”的命名方式,但它们也提供智能算力,所以也可以算作智算中心,例如合肥先进计算中心和浙江(长三角)新一代全功能智能超算中心。

不同智算中心的测算算力时采用的算力测试基准有所差别,使用算力单位略有不同,但是无论是“1 P OpS”、“1 PFLOPS FP16”、“1  Petaflops”还是“1 P”,都相当于每秒可进行一千万亿次运算。

2022 年开年以来,国内已经有一个新投运的智算中心,是位于上海的商汤科技人工智能计算中心。

很多城市是正在建设智算中心,从 2021 年 1 月 1 日到 2022 年 2 月 15 日,全国共有至少 18 个城市签约、开工、招标、计划建设智算中心项目,其中已经宣布开工建设的至少有 6 个城市,分别是合肥、庆阳、大连、沈阳、深圳、长沙。

▲ 截至目前,2021 年和 2022 年各地规划或已经开始建设的智算中心情况

对比 2021 年之前的各地智算中心建设情况来看,2020 年之前的智算中心项目更少一些。不过,部分 2021 年开工建成的智算中心其实在 2020 年就已经立项招标和预研规划,比如武汉人工智能计算中心项目。

智算中心并不是 2021 年才有的新类型数据中心,我国较早建成的智算中心还有深圳鹏城云脑、旷视芜湖 AI 超算中心等。2018 年,鹏城云脑 I 初步建成并上线运行,算力达到 100 PFLOPS(1 PFLOPS 相当于每秒运算能力为一千万亿次)。

二、100P 算力起步,还没建成就被“约满”

从全国智算中心的地理位置分布来看,目前,东部、中部和西部都有省市在部署智算中心。作为数据中心的一种,各地的智算中心建设规划难免会受到“东数西算”政策的影响。

特别是国家发改委等部门在《全国一体化大数据中心协同创新体系算力枢纽实施方案》等文件中指出:“原则上,对于在国家枢纽节点之外新建的数据中心,地方政府不得给予土地、财税等方面的优惠政策。”智算中心作为各地政府主导的项目,极有可能受到影响,但是并不一定会大批向西部地区迁移。因为智算中心主要面向 AI 相关产业,这些业务对于网络通信的要求也比较高,在这方面,东部地区略有优势。

中科曙光高级副总裁任京暘告诉智东西,“东数西算”工程会促进智算中心的发展,预计在全国一体化算力网络国家枢纽节点建设中,规划的数据中心项目会配置一定规模的智能算力,有些项目还可能是直接以智算中心的形态出现。

另外,从这些智算中心公布的算力规模情况来看,100P 算力是很多智算中心的起步目标

一般认为,100P 大约相当于 5 万台高性能电脑的算力。拿科研场景为例,天文学家在 20 万颗天体的星空图中要定位某种特征星体,如果算力不够,耗时可能要超 100 天,如果拥有 100P 算力,定位星体所需时间仅为 100 秒。

任京暘说,一般智算中心提到的 100P 是指 FP16 或 INT16,即半精度算力,就现阶段而言,以 100P 起步,能实现比较大的规模效益。

从需求角度看,智算中心作为城市级公共算力平台,要满足区域内政府、企业、高校等各类用户的算力需求,起步规模不宜过小,否则无法支撑类似大模型训练等大算力需求,也不足以发挥集约共享的规模效益。

任京暘补充道,从投资角度看,智算中心发展尚处于初期阶段,建设、运营、应用与生态建设等投入较大,需要结合地方财政承受能力做出合理评估,根据实际需求进行适度的超前部署。

大部分智算中心都是分期建设的,建成一期,就可以投入运营一期,后期再根据运行情况和产业发展需求进行二期、三期建设。

例如武汉人工智能计算中心,该智算中心在 2021 年 5 月完成了一期项目建设工作,并开始为企业提供 AI 算力,但很快饱和了。于是,武汉人工智能计算中心又进行了二期项目扩容工作,将算力规模从 100P 扩容到 200P。武汉人工智能计算中心相关负责人在接受媒体采访时说,现在二期算力也接近饱和,随着准备进行进一步的算力扩容工作。

▲ 武汉人工智能计算中心

根据各智算中心的数据,至少数百家企业已经签约智算中心,例如武汉人工智能计算中心已经为多家高校和科研院所、100 多家企业提供算力,南京智能计算中心已经吸引超 40 家产学研机构入驻。

一个智算中心可以同时支撑的产业场景很多,例如自动驾驶、智慧医疗、智慧城市、智慧交通、智慧矿山、智能制造等等,主要看当地的需求,一般都是为了支撑当地的优势产业更好发展。比如,青岛靠近海域,其人工智能计算中心招标文件就有提到青岛人工智能计算中心要支撑青岛优势产业集群,比如智能家居、智能制造等产业智能化持续领先,并着重强调支撑当地智慧海洋经济的发展。

上述智算中心都并不局限于支撑单一产业。不过,也有一些城市选择建设针对性更强的智算中心,像山西晋城建设了专门面向煤炭行业的智算中心(智能矿山创新实验室创新成果 & 计算中心)。该智算中心由华为、晋能控股等企业参与建设,主要是为推动山西煤矿智能化建设。

▲ 智能矿山创新实验室创新成果 & 计算中心

三、地方智算中心大潮背后的科技力量

在智算中心建设过程中,市政和建筑设计企业背后的 AI 和 ICT 企业是重要角色,例如曙光、华为、浪潮、腾讯、商汤科技等企业。

目前,曙光 5A 级智算中心已在广东珠海、安徽合肥、浙江桐乡等地陆续落成,其江苏昆山等地的智算中心也进入建设阶段。

▲ 合肥先进计算中心

曙光智算中心会采用兼容多种芯片、算法、模型等的多元协作方式以实现多元算力提供。例如曙光参建的合肥先进计算中心不仅能提供智能算力,还能提供高性能计算所需算力。在降低智算中心、数据中心能耗方面,曙光研发有浸没式相变液冷技术,可使智算中心的 PUE 值降至 1.04 到 1.05。

华为应该是比较早尝试智算中心的企业,而且也是参与各地智算中心建设最多的企业之一。华为昇腾计算业务总裁许映童曾在 2021 世界人工智能大会期间透露,华为希望在 2021 年内启动超 20 个智算中心建设

包括“鹏城云脑 II”、“武汉人工智能计算中心”在内的几个华为承建的智算中心项目几乎都是使用华为的 Atlas 900 AI 集群架构,来实现 AI 算力供给的。Atlas 900 AI 集群架构是由数千颗昇腾 910 AI 处理器构成,其总算力达到 256P~1024 PFLOPS  FP16。

▲ 鹏城云脑

浪潮在智算中心方面也有多年的研究,无论是智算中心运行过程中算力生产、算力聚合、算力调度还是算力释放环节,浪潮都分别有相应的技术和软硬件支撑。南京智能计算中心就是采用了浪潮 AI 服务器算力机组和寒武纪思元 270 和思元 290 智能芯片及加速卡。

▲ 南京智能计算中心

作为数据中心行业的重要玩家,腾讯将其在数据中心方面的探索应用在了智算中心建设中,像腾讯智慧产业长三角(合肥)智算中心建设中就用到了腾讯第四代 T-Block 等高端模块化技术,支持项目快速交付。腾讯第四代 T-Block 等高端模块化技术就是将 IT、空调等数据中心的各个功能模块化,以实现按需灵活配置。

商汤科技是从 2018 年开始进行人工智能计算中心预研工作的,2020 年 7 月开始商汤科技人工智能计算中心建设工作。2022 年 1 月 24 日,商汤科技人工智能计算中心启动运营。商汤科技人工智能计算中心的峰值算力高达 3740 Petaflops,这背后包含了商汤科技的多种技术突破,包括高性能计算、分布式调度、硬件 / 软件协同设计等。

▲ 商汤科技人工智能计算中心

结语:2022 年大批智算中心将建成投运

我们通过调查 2021 年以来建设和建成的智算中心,发现越来越多的城市已经开始了智算中心建设。这体现了各地对于 AI 产业的重视。从一些现有的智算中心建设工期来看,一般一期建设大概时间在半年到一年不等,今年可能会有更多在建的智算中心建成并投运。另外,“东数西算”工程也会对新的智算中心的规划、建设产生多重影响。

目前参与智算中心建设的企业相对有限,随着各地对智算中心建设需求的增加以及一些新玩家加入,智算中心领域玩家可能会面临更激烈的竞争。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注