5月中旬,NVIDIA正式发布了全新一代“安培”Ampere) GPU架构、GA100 GPU核心,并宣布了首款产品“A100”加速计算卡,采用专有的SMX4形态。
今天,基于标准PCIe形态的A100计算卡登场了,更适合主流标准服务器。
PCIe A100仍然基于GA100核心,规模保持不变,还是台积电7nm工艺、826平方毫米、542亿个晶体管,提供6912个FP32 CUDA核心,最高加速频率也是1.41GHz,因此峰值性能相同:单精度19.5TFlops、双精度9.7TFlops、INT8推理1248Tops、INT8张量624Tops、FP16张量312TFlops、FP32张量156TFlops、FP32训练312TFlops、FP64高性能计算19.5TFlops。
NVIDIA宣称,相比于上代Volta伏特架构的V100计算卡,INT8推理性能、FP32训练性能都实现了20倍的提升,FP64高性能计算也提升了2.5倍,是历史上进步最大的一次。
显存依然搭配40GB HBM2,512-bit位宽,2.4GHz频率,1.6TB/s带宽。
由于散热限制,热设计功耗从SMX4版本的400W大大降低到了250W,如此还能维持相同的峰值性能堪称奇迹,当然实际负载持续性能显然无法做到满血,但官方表示仍能有大约90%。
另外一点不同就是多卡并联,SMX4版本支持最多八块并行,PCIe则只能两块并行,NVLink互连总线显然做了精简,但具体未披露,可能从12条砍半至6条。
NVIDIA没有披露PCIe A100计算卡的出货时间和价格,应当会很快。AMD霄龙无疑仍然还是其最佳搭档,后者仍是唯一支持PCIe 4.0的数据中心平台。
视频会员活动汇总>>
爱奇艺视频会员限时优惠5折
优酷视频会员年卡5折购99元)
腾讯视频会员年费99元/京东plus联合年卡128元