来源:内容来自「fortune」,作者:JEREMY KAHN,谢谢。
软银旗下的英国半导体设计公司 Arm Holdings 周一公布了两款用于人工智能应用的芯片设计。
一款名为 Arm Cortex-M55 处理器的芯片是 Arm 的微控制器系列中的最新产品,它是一款相对低成本,高能效的芯片,用于运行传感器和执行一些简单的计算任务,适用于多种领域,包括汽车引擎、遥控玩具以及电动工具等。
在过去,这些类型的芯片通常缺乏足够的计算能力来有效地执行机器学习功能。相反,这些任务中的大多数必须在更高功率的芯片上执行,比如 Arm 的 Cortex-A 微处理器,这些微处理器存在于世界上大多数智能手机中。
另一款新芯片名为 Arm Ethos-U55 NPU,其设计是与 M55 配合运行,以满足有神经网络加速需求的应用。
在过去的十年里,人工智能的大部分进展来自于在图形处理单元上运行这些神经网络,这是一款专门的计算机芯片,最初是为了处理用于视频游戏和动画的图像渲染所需的密集数字运算。
但是,最近,一些公司创建了 NPU,即“神经处理单元”,专门为运行神经网络设计的芯片。在基准测试中,这些芯片可以比 GPU 更快、更有效地运行神经网络。Arm 声称 Ethos-U55 是业界的第一个“微型 NPU”,换句话说,它是这些神经网络专用芯片中的第一个,足够小,足够省电,可以在最小的电子设备上运行。
麦肯锡咨询公司(Consul tants McKinsey&Company)预测,到 2025 年,与 AI 相关的半导体年销售额可能达到 670 亿美元,约占所有计算机芯片需求的 20%。另一家咨询公司德勤(Deloitte)预测,AI 专用芯片的市场今年将达到 26 亿美元,到 2024 年将翻一番。
Arm 在 2018 年首次进军 AI 专用芯片市场,当时推出了机器学习处理器的设计,另一款专门针对检测图像中的物体。但这两种处理器都是为电力效率和成本不那么关键的环境设计的。
这家英国公司并不是唯一一家希望为低成本、高效率的传感器和电子产品提供机器学习能力的芯片制造商。作为推动 5G 移动业务的一部分,华为已经投资于廉价的 NPU,但它已经将这些芯片打包为更高端手机的更大芯片的一部分,比如麒麟 970 芯片。英特尔在边缘计算市场通常并不活跃,而是以数据中心和个人计算设备为目标。AMD 开发了一些芯片,旨在在智能电视等设备上运行 AI 应用程序。
Arm 公司并不自己制造半导体,而是将其设计授权给其他公司,该公司表示,基于这两种新设计的芯片将于 2021 年交付给客户。虽然该公司拒绝透露这个新设计的客户名字,但在过去,Arm 已将其特定于 AI 的设计授权给包括三星、STMicroElectronics 和 NXP 在内的公司。
该公司表示,通过将这两种新芯片作为一个组合一起使用,在运行机器学习任务的速度上实现了 480 倍的增长,这与它以前在基准测试中的 CortexM 芯片相比。(首批 15 倍提速来自 M55,与 Ethos-U55 结合后又有 32 倍的提速。)将这两种芯片一起使用也会提高 25 倍的能源效率,这对于许多必须依赖于电池的设备来说是至关重要的。但 Arm 没有透露其新芯片与竞争对手的 AI 芯片相比的性能如何。
Arm 的高级副总裁兼汽车和物联网业务总经理迪普蒂·Vachani 说,新芯片允许将 AI 应用带到农业等领域。在这些领域,数百或数千个装有机器学习的低成本传感器可以用来仔细校准每个工厂应该接收多少水、肥料或杀虫剂。物联网代表了物联网,连接各种新设备的想法,从安全摄像机到烤面包机,再到互联网。
Vachani 还表示,让 AI 在相对低功耗的设备上工作,而不是与当今大多数 AI 工作负载所在的基于云的数据中心保持经常通信,对于数据安全和隐私至关重要。
例如,她说智能扬声器,如 Alexa 或 GoogleHome,可以直接在设备上运行语音识别和一些机器学习应用程序。如今,这些设备不得不通过互联网将数据传输到远程数据中心,引发了人们对网络安全和窃听的担忧。
她还表示,人工智能在非互联,相对低功耗的设备上工作对于实现互联汽车以及最终实现无人驾驶汽车的实现以及将机器学习带入医疗设备至关重要。
Arm 说,M55 本身将能够承担机器学习任务,从非常简单的振动检测——甚至是前几代 Cortex-M 都能处理——到检测图像中的物体。当与 EthosU-55 相结合时,它可以承担更高层次的任务,例如检测特定的手势,决定你的指纹或你的脸是否与设备上已经存储的生物特征相匹配,甚至语音识别。但是,更多的计算密集型任务,比如对各种各样的物体进行分类,或者从人群的视频中实时识别面孔,仍然需要更多的耗电和昂贵的芯片。
Vachani 还说,新的芯片设计只是为了执行所谓的 AI 推理,这涉及到数据输入和使用一个统计模型,已经训练,以作出预测从该数据。模型的实际训练,机器学习的“学习”部分,仍然需要在更强大的芯片上的数据中心完成。