作者:韩朴宇
链接:https://www.zhihu.com/question/308298687/answer/568737742
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
胡乱分析一波,和Intel比一比.
顶级的Intel Xeon产品:Intel® Xeon® Platinum 8180 Processor (38.5M Cache, 2.50 GHz)
内核数28
线程数56
处理器基本频率2.50 GHz
最大睿频频率3.80 GHz
缓存38.5 MB L3
鲲鹏920主频可达2.6GHz,单芯片可支持64核
鲲鹏920策略是单核IPC不够多核来凑,从核心数上压制了8180,毕竟A76核心面积小,频率上鲲鹏920的2.6GHz不能说是很高,可能是初代7nm工艺的限制.
性能上鲲鹏920显然不是Xeon 8180的对手,但是鲲鹏920不是面向高性能计算市场的.
能耗和能效比上鲲鹏920显然领先,A76主要目标是手机,加上7nm的优势,比Intel的电老虎省电多了.
以下才是亮点
该芯片集成8通道DDR4,内存带宽超出业界主流46%。芯片集成100G RoCE以太网卡功能,大幅度提高系统集成度。鲲鹏920支持PCIe4.0及CCIX接口,可提供640Gbps总带宽,单槽位接口速率为业界主流速率的两倍,有效提升储存及各类加速器的性能。
Xeon 8180:
最大内存大小768 GB
内存类型DDR4-2666
最大内存速度2666 MHz
最大内存通道数6
PCI Express 修订版3.0
PCI Express 通道数的最大值48
内存通道比Intel多2个,显然带宽更高.
这个IO真的是吹爆,实现了比Intel更快的PCIe4.0,而且还有CCIX.
CCIX(针对加速器的缓存一致性互联总线)是兼容PCIe的高速总线,由于PCIe4.0迟迟不发布,AMD、ARM、华为、Mellanox、高通、赛灵思(就是没有PCIe的发起者和控制人Intel)共同发起CCIX这一开放的总线标准,速度达到25Gbps以上,CCIX允许基于不同指令集架构的处理器将其高速缓存一致性扩展到加速器.胡乱瞎想一下,鲲鹏920的计算性能不强,但是IO性能很强,可以通过CCIX总线在鲲鹏920和AMD的EPYC之间构建异构平台,实现性能和IO均超过Intel的效果(当然异构计算想要达到理论效果,编程难度不小),如果配合上国产ryzen就能实现全国产化.
RoCE(RDMA over Converged Ethernet,RDMA:Remote Direct Memory Access)也是为了实现异构计算的,用以太网直接访问内存,和infiniband功能类似.
可见,鲲鹏920搞差异化竞争,发扬农村包围城市的传统,知道自己如果直接和Intel的高性能计算比肯定和高通一样凉凉,但是可以在异构计算,高性能数据中心站得住脚,而且比Intel有功耗上的优势.
也希望麒麟能早日制造出自研ARM架构,在IPC上也能达到较高水平.
泰山 ARM 服务器方面,可以满足国产化的需求,但是云服务市场竞争很激烈,AMD的EPYC服务器也很便宜,但是很多公司不愿意用,就是因为很多软件优化是针对Intel架构的,而到了ARM平台上,许多软件都没有移植,优化也不如X86,华为有操作系统团队,听说还把自家Linux认证为Unix了,不知道有没有编译器团队,arm生态需要一个ICC一样专门优化的编译器.