北京日报客户端 | 记者 赵语涵
美国当地时间9月30日,特斯拉于加州帕罗奥图举办2022 AI Day活动。特斯拉CEO埃隆·马斯克与特斯拉工程师团队现身会场,带来了Tesla Bot人形机器人“Optimus”原型机的全球首秀。马斯克还表达了对AI、机器人领域高端人才的欢迎,称:“我们希望通过展示新技术吸引全球人才加入,共同努力把人工智能做得更好,为全人类做出贡献。”
此外,特斯拉还公布了FSD(完全自动驾驶能力)和Dojo超级计算机的最新进展。目前,特斯拉已在超过16万辆车上进行了FSD Beta版系统测试,仅一年内就训练了7.5万个神经网络模型。
Optimus机器人原型机首秀
“今天是我们第一次将Tesla Bot展现给世人,准备好了吗?”在马斯克的话音中,Optimus原型机重磅登场,转身、停止、挥手问候等流畅动作引起观众欢呼。
这是Optimus第一次在无人操作的情况下自主行走,特斯拉没有为它安装外壳,而是直接将内部构造呈现出来,关节、骨骼、电缆等设备清晰可见,直观展示每个动作细节。特斯拉还在视频中展现了现实中Optimus的使用场景。办公室内,它灵活地提起水壶浇花、双手搬运物料至目标位置、准确定位周围人员并主动避让。据媒体报道,特斯拉弗里蒙特工厂中Optimus已经开始投入简单工作,并为其规划了相应行动路线。
马斯克表示:“我们的产量应该可以达到数百万台,预计它的价格比汽车便宜得多,预估机器人最终价格将达到2万美元以下。”他还预测,3至5年间Optimus即可量产上市。
Optimus借鉴多项特斯拉造车技术
去年AI Day后,短短6个月时间Tesla Bot就从一个概念迅速走向现实。今年活动现场上,特斯拉多位工程师讲解了Optimus机器人的设计原理与研发故事。
特斯拉在机器人的内部结构设计上,基于对人体特征的洞察,深度思考各执行器与电力系统布局。机器人躯干处搭载了2.3 kWh、52V电池包,高度集成了充电管理、传感器和冷却系统。“这意味着从传感到融合、再到充电管理,都汇集到这一系统内,这也是借鉴了我们在汽车设计方面的经验。”特斯拉工程师表示。
Optimus身体共有28个自由度,采用了更加灵活的弹簧负载设计与6种类型执行器,关节采用仿生学关节设计,模拟人类关节与肌腱形态,手部则采用人体工程学设计,拥有11个自由度。而在“感官”上,在经过完全自动驾驶能力系统的实际应用验证后,特斯拉强大的计算机视觉已可直接应用于机器人。
目前,Optimus已经可以完成行走、上楼梯、下蹲、拿取物体等动作,灵活的双手得益于合理的手指关节设置,柔韧性和强度表现俱佳,执行器既能够承受约半吨重的钢琴这样的重物,也可以完成轻薄物体抓取、操作机械装置、复杂手势等高精度动作。
行走,对于人类来说可能是再简单不过的日常动作,但机器人要实现稳定行走则充满巨大挑战。首先特斯拉需要让机器人具备物理层面的自我认知,保障运动能效、保持平衡以及迅速应对环境中的风险,同时也要兼顾四肢长度、重量等方面。“我们一直在从生物学中汲取更多灵感,”特斯拉工程师表示,“而在运动、规划和控制性上,我们在汽车领域已经积累了充分经验,在机器人上得以活用。”
同时,特斯拉还基于汽车安全模拟分析能力打造机器人安全性。在交通事故模拟中,特斯拉通过软件优化和改进车辆溃缩、电池保护等提升安全表现,而在机器人设计上,特斯拉也以同样的方式保障Optimus 保护自身和周围人安全的能力。如在跌倒、碰撞等外部状况下,机器人将采取和人类一致的决策——最大程度优先保障“大脑”安全,其次是躯干电池组的安全,这两部分的重要性也不言而喻。
目前,Optimus不仅可以平稳行走,也能在少量外部干扰的情况下依旧保持平衡。现场视频中,特斯拉还展示了Optimus被工作人员用木棍戳上半身,但并未摔倒或长时间摇晃,仅稍微前倾后便稳住姿态,出色地应对了挑战。
应用FSD训练经验构建“大脑”
“机器人需要有‘大脑’,也就是人工智能。”马斯克说。在设计、训练与制造Optimus的过程中,特斯拉大量应用了人工智能技术,并在现场介绍了Optimus的中央计算机。
Optimus搭载与特斯拉车辆相同的FSD电脑以及Autopilot相关神经网络技术,自动驾驶技术上的研究成果也帮助特斯拉在人形机器人领域打下了坚实基础。“其实特斯拉车辆已经安装了FSD电脑,我们希望可以将自动驾驶经验与人形平台相结合,”特斯拉工程师表示,“但机器人的实际需求和形式都与汽车存在差异,所以我们还需要适当调整。”
特斯拉希望机器人的“大脑”要尽可能做到人类大脑所能实现的一切,比如处理视觉数据、基于多个传感器输入做出行动决策、支持通信交流等。Optimus采用了与Tesla车辆相同的芯片,支持Wi-Fi、LTE链接和音频交流,系统软硬件的安全性保障也再度提升。
同时,Optimus也通过动作捕捉“学习”人类。以搬运物品为例,特斯拉工作人员通过穿戴式设备输入动作,机器人通过神经网络学习,从在同一地点完成相同的动作,到进化推演出在其他场景下的方案,从而学会在不同环境中搬运不同的物品。