今天,特斯拉的第二届 AI Day 终于正式召开了。
AI Day 是特斯拉的年度活动之一,其他的固定活动还包括 Battery Day、Autonomy Day,顾名思义就是专门面向 AI、电池技术和自动驾驶相关的活动。
今年的 AI Day 拖延了一个多月。上个月马斯克透露,跳票是为了多留点时间,这样在 AI Day 上就能展示可用的人形机器人“擎天柱”Optimus) 了。
果然马斯克没让大家失望:
我们看到了擎天柱的原型产品(代号似乎是 Bumbleseed) :
/ 开发仅 8 个月,已具独立行动能力 /
不理那些噱头,先来看原型机器人究竟有多厉害。
这台代号 Bumbleseed 的原型机器人,没有去年我们在 Tesla Bot 假人上见到的外壳,所有的内部非关键零部件都裸露在外:
原型机器人身高大约 5 英尺 8 英寸(约 173cm),体重 73 公斤。
它在感知和计算的部分基本采用的是特斯拉电动车相同的设备,包括 特斯拉自主研发的芯片集成系统作为“大脑”,以及三颗 Autopilot 级别摄像头。
另外,去年设计 Tesla Bot 的头部还有一块显示屏,能够显示对于用户 / 工作伙伴有用的信息。这个设计在今天并没有任何进展可以宣布。这是因为团队在过去一年时间里主要在专注解决运动(locomotion),而不是应用软件的问题。
原型机器人的行走速度还很慢,似乎远没有达到去年宣称的每小时 5 英里(大约 8km / h)水平。
至于搬运能力,它可以搬运大约 20 磅(约 10kg)重的中小型货物,比如快递纸盒。这个载荷比去年宣布的少了一半。
擎天柱全身共有 28 个电机“关节”,比去年宣布的时候的 40 个减少了四分之一。这是因为电机越少功耗越低。
在坐姿待机状态下,机器人的全系统功耗只有 100W,还不到当今主流显卡的一半;而在走路的状态下,整个功耗也只有 500W。
马斯克和机器人团队成员一再强调,让机器人更省电是非常重要的设计理念,因为特斯拉的终极目标是大规模生产人形机器人,并且在各种工业、民用场景里投放使用,量级在百万甚至千万级。
下图中蓝色的是电子系统。橘色部分是电机。
先来看电子系统部分:
机器人的设计电池容量为 2.3 千瓦时,电压 52V;机器人的“大脑”部分并不是真的放在脑袋里,而是安装在了躯干位置(因为这里更加安全,并且集成度越高越省电);
机器人在网络连接方面支持 Wi-Fi 和 LTE,并且包括音频组件,都安装在躯干上。
再来看机运动能力。
特斯拉机器人团队成员透露,他们用了一套和电动车碰撞安全测试相同的预测模型,来提前预测机器人在各种姿势下,在执行正常工作时候的表现,以及预测可能导致机器人受损(比如摔倒和遭遇攻击)等各式各样的情况。
然后,工程团队对收集到的各种工况数据,通过微积分方式进行了大量的模拟,从而微调电机的工作功率,从而将能耗降到最低;另外,他们还从不同的电机数据中找到共性,从而降低不同型号电机的使用。
最终全身的 28 个电机当中,只有 6 种不同的设计,显著降低了机器人批量生产的成本。
这些电机当中,有载荷能力极强的大电机,足以轻松提起一台三角钢琴的重量;也有手部微小但灵敏的小电机,不仅能够抓住有一定重量的货物,也可以精确地抓握小零件、操作较为精密的工具仪器等。
去年马斯克曾经说过,人形机器人的使命,是替代人类去完成危险、重复和无聊的工作。
它的初步设想是让用户可以对它提出简单的命令,比如“把灯泡装上去”之类的,它就可以执行。公司对于擎天柱的定位是“泛用型 AI 机器人”,说白了就是苦力机器人。人机智慧型交流并不是它的设计能力之一。
特斯拉虽然有种种问题,但不可反驳的是,这家公司能够走到今天,靠的真就是对科技创新的疯狂追逐,和马斯克本人强烈的、谁都无法阻挡的意志。去年还有很多人怀疑特斯拉到底是真的要造机器人,还是跟大家开玩笑。结果今年,马斯克还真没有食言。
也许在未来的某一天,擎天柱真的可以取代特斯拉在全球各地的汽车制造工厂里面的工人 —— 他们的工作确实危险、重复且无聊。
去年马斯克还曾表示,这台机器人不会跑的太快,“我们的设计指标是让你可以轻松地不被它追上,并且有很大的几率制服它。”
“最好这种情况不会发生,但谁知道呢。”他补充道。
从去年只有一个假人可以展示,到今年已经有可以独立运行的原型机,特斯拉人形机器人团队在 6-8 个月极短的时间里已经取得了非常长足的进展,自己已经对团队的成果非常满意。
接下来几周到几个月的时间里,特斯拉还会继续组装出更多的机器人,投入到真实的工业场景(比如特斯拉自己的加州 Fremont 工厂)里进行测试,从而进一步优化设计。
/ Dojo 超级计算机 /
从 2019 年,特斯拉在内部启动了一个神秘的项目 Project Dojo,开发采用自研芯片,可以无缝连接,实现超大规模分布式计算的多芯片模组化 Multi-Chip Modularized) 超级计算机。
这台超级计算机,就是在去年 AI Day 上展示的 Dojo。
Dojo 核心是特斯拉自主研发的 D1 处理器,采用台积电 7 纳米制程工艺,单片包含 500 亿枚晶体管、11 英里的线路长度。处理器采用了特斯拉自定义的指令集,FP32 算力达到 22.6TFlops,设计功率 400W 左右。
但是和处理器的 I / O 带宽相比,算力并没有那么重要。这是因为目前自动驾驶计算平台的主要限制不是算力,而是数据传输,而这台超级计算机正是想要解决这一问题,加快对真实世界的快速感知、计算和数据传输,从而显著改进自动驾驶模型的训练性能。
去年特斯拉宣称 Dojo 所采用的的 D1 处理器的片外带宽远高于谷歌 TPU 和其他科技公司的 GPU-based 分布式计算阵列。
超高的片外带宽尤为关键,因为对于特斯拉而言,D1 Chip 不是一枚一枚用的,而是可以多枚组成一个计算阵列。比如 25 枚组成一个训练模组 Training Tile),成为了 Dojo 的单元核心,高达 36TB / s 带宽,达到 9PFlops 算力。
去年特斯拉透露已经完成了对训练模组的工作测试,成功运行了前特斯拉 AI 部门总监 Andrej Kaparthy 开发的 minGPT 模型。而在过去的一年里,特斯拉持续对 Dojo 进行优化研发。
在今天的 AI Day 上,Dojo 团队宣称一个训练模组的机器学习训练算力,足以达到 6 个“GPU 计算盒子”,并且成本还不到“一个盒子”的水平。
这还没完:6 台训练模组组合为一层,两层叠在一起为一个训练矩阵(单机柜)
再把机柜链接起来,能够形成“完全体”,也即 Dojo 计算集群 ExaPod,包括 120 个训练模组、3000 枚 D1 处理器,FP16 算力高达 1.1 EFlops。
在此之前,Dojo 系统主要是服务特斯拉内部使用,比如路测数据标注、模型训练、运行模拟以及硬件在环任务等。
但更重要的是:Dojo 本质上是一个 ASIC 属性的计算设备,也就可以被看作是一个通用型的神经网络训练设备,也是可以提供给其它机构使用的。
也许在不远的未来,我们可以看到特斯拉不只是电动车 / 清洁能源公司,还是机器人公司、芯片公司,甚至…… 云计算公司?
注:图来自于特斯拉,版权属于原作者。如果不同意使用,请尽快联系我们,我们会立即删除。
本文来自微信公众号:硅星人 (ID:guixingren123),文|杜晨 编辑|VickyXiao