特斯拉AI Day 2022轻解析：14万的人形机器人、FSD正式版与“你瞅啥”彩蛋 -6parkbbs.com

2022年10月1日9:15，延迟了75分钟后，特斯拉AI Day 2022的神秘大幕终于徐徐揭开。

像此前预测的一样，在这一届AI Day上，特斯拉推出了可以在装配线中替代人工，售价不超过2万美元的人形机器人Optimus擎天柱、FSD更先进的路径规划及架构，以及DOJO超级计算机阵列。

由于本届发布会极度硬核（马斯克本人表示本节发布会实际上是一次招聘宣讲会），所以本文仅从产品介绍、核心技术概述以及未来可实现的功能进行浅析。

【机器人Optimus擎天柱，有什么用？】

你不愿意干的，我来！

危险的，我来！

枯燥的，我来！

甚至未来全球人口锐减了，我也能顶上！

Optimus擎天柱是特斯拉研发的一款仿生人形机器人，身高173cm，和我差不多，57 公斤，比我轻5kg。

马斯克称该款人形机器人的量产售价比汽车价格低，最终价格低于2万美元，使用的是和特斯拉汽车一样的FSD计算机，最终产量可达数百万个。

为什么是仿生机器人？因为特斯拉想让Optimus擎天柱实现和人类一样的交互、动作、行为以及物理层面的自我意识。

这意味着，整个机器人不仅仅是机械运动层面的问题，更是AI、人工智能和感知体系方面的多维度复杂问题。

Optimus擎天柱能实现什么功能呢？比如浇花和在产线上组装特斯拉汽车。

Optimus擎天柱的手部非常灵活，拥有11个自由度。内部高度集成充电管理、传感器、冷却系统的电池包，具备保护自身和周围人安全的能力，执行器可提起半吨重的钢琴，还可以利用动作捕捉“学习”人类依靠视觉的AI算法和学习，机器人能知道手在空间的位置，并准确拿取物品。

还可以自由穿行于狭窄的空间。

为了实现像人类一样的自由行走，Optimus擎天柱全身共有28个可以活动的环节（橙色部分），约12个电动机动力单元，1个2.3度电的电池组以及1颗特斯拉FSD超算芯片，以及实现对话、声音、联网等交互需要的功能模块。

Optimus擎天柱感知世界的方式和人类一样，都是视觉。

可以看到，不同的物体被以不同的颜色划分；而在后端，环境感知是以“Occupancy Network”的形式存在的。

可以看到，摄像头的图像在“Occupancy Network”中被处理为一个一3D染色方块，白色方块表示静止物体，包含大小高度占用体积等关键信息；绿色方块表示移动物体，需要对每一个绿色的染色块进行行为预测。

摄像头拍摄现实世界的图像，随后使用“Occupancy Network”等等算法进行物体检测、行为预测、动作规划（locomotion plan) ，再将运算结果输出给各个负责执行的电动关节。

是不是感觉有些似曾相识？

没错，Tesla的Autopilot自动驾驶也是这么做的。

Optimus擎天柱对于人类来说有什么实际的作用呢？

特斯拉给出的应用场景是“危险、重复、繁琐的任务，对于人类来说，体力工作只是一种选择，人人都可以从事富有创造力的脑力工作。

我个人的看法是短期内出现在实际生活中的可能性不大，大概率会先布局在特斯拉的汽车产线上替代一些简单基础的工作，比如搬运轻一点的零件、搬运杂物、抓取并组装车门等外饰件。

至于未来，我很希望Optimus擎天柱能被应用在医疗、照顾老人等领域。

毕竟交互和软件是特斯拉的长处，Optimus擎天柱脸部也有一块可以实现交互的屏幕，比波士顿动力等其他类人型机器人更有亲和力。

马斯克称特斯拉机器人的产量将可以达到数百万台，价格会比汽车便宜得多，可能不到2万美元，有望在3-5年时间内交付。

【小彩蛋：你瞅啥！性感猫女机器人】

众所周知，特斯拉是很喜欢鼓捣一些文化周边的，比如这个。

特斯拉Giga Texas纪念徽章。

作为彩蛋，这一纪念徽章也出现在Optimus擎天柱的腰带扣上。

有意思的是，这上面还印了一句颇有德州风情的话——Don't Mess With，翻译成中文是别惹我，翻译成东北话就是“你瞅啥”。

或许是觉得Optimus擎天柱过于男性化，不够性感，马斯克表示“还将为Optimus推出一款猫女版”。

大概就是这个样子。

【FSD：如何用摄像头实现激光雷达的效果？】

每届AI Day必提FSD和Autopilot自动驾驶，这是特斯拉汽车的灵魂，也是招牌，更是重头戏。

上一届AI Day主要讲了“FSD如何感知世界”，这一届AI Day则主要讲“FSD如何规划和控制”。

也就是这一段的小标题，如何使用摄像头来实现类似激光雷达的效果。

在这一部分中，AI DAY透露了大量用来训练AUTOPILOT自动驾驶的新算法和新概念，硬核到让人以为是天书。

大家可以这么理解：

不用高精地图的特斯拉，坚定不移地走纯视觉感知路线，FSD旨在不断训练感知深度神经网络来实现和激光雷达点云物体标注相同的感知效果。

环绕车身的8颗摄像头并不一定认识每一个障碍物是什么，但都可以识别出来，形成如上图所示的3D矩阵，完成场景标注，然后通过规控绕开障碍物。

这一点也是特斯拉与其他走激光雷达+摄像头感知路线厂商最大的区别。

因为对于物体识别而言，激光雷达扫描出的点云图像同样需要经过人工建模和深度学习，否则就只是一堆没有任何信息的点。

借住全新的算法和技术，特斯拉表示能”尽可能高效率和高安全性地解决无保护左转问题尽”。

在AI Day中，特斯拉也小秀了一把FSD发展到今天取得的成就。

截至本届AI DAY，全球已有16万用户参与到FSD Beta（完全自动驾驶能力测试版）的测试工作中。

相比2021年，参与人数实现了80倍的增长。

2022年，特斯拉已训练了7.5万个模型，基本每8分钟就完成一个模型的训练。

【Dojo机柜：用海量算力填平时间的鸿沟】

别人计算几个月，我们一周，让FSD尽快摘掉Beta的帽子！

算力有什么用？举个例子。

无论是Tesla的自动驾驶汽车，还是Optimus擎天柱机器人，都需要对复杂多变的世界及时做出反应。

在上方照片中，需要浇水的绿植被精确地、边际清晰地标注为酱红色。

假设这需要一个GPU计算并深度学习1年时间。

算力的意义在于极大地缩短这一时间，也就是小标题中的那句话，用海量算力填平时间的鸿沟。

Dojo机柜

根据AI Day上的数据，自动驾驶拍摄的每个视频有多帧图像，需要14亿帧才能训练一个神经网络，需要耗费10万个GPU工时。

Dojo的到来，可以将通常需要几个月的工作减少到1周。

Dojo由特斯拉自研计算芯片D1集成，25块D1集成为一个计算模块。

一个计算模块，相当于6个通用GPU Box性能，而成本低于1个GPU。

耗能比上，特斯拉自研芯片比外采的Nvidia A100高效、节能得多。

10个Dojo机柜组成了特斯拉自建超算的基本模块单位ExaPOD。

每个ExaPOD集成120个训练模块，包含3000个D1芯片，超过1百万个训练节点，算力突破 E 级算力，每秒可进行1.1百京（百亿亿，10^18）次的浮点运算，并拥有1.3TB高速SRAM 和 13TB 高带宽 DRAM。

像这样的超级集群，特斯拉打算2023年之前在美国加州PaloAlto建造第一台Dojo ExaPod超级计算机集群，并在未来一共建造7个。

这样的超算集群有什么意义呢？

意义在于能让FSD尽快摘掉Beta的帽子。

发布会结束后马斯克表示：“目前FSD软件已经可以适用于全球各个地区的路况，如果地方监管政策允许，我们可以在今年年底面向全球推出FSD Beta版本软件”。

评分完成：已经给本帖加上 20 银元！

所有跟帖: ( 主贴楼主有权删除不文明回复，拉黑不受欢迎的用户 )

打开微信，扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮

楼主本栏目热帖推荐：

机器人笑了，我却笑不出来 04/14/24
美媒反思：美国错失引领芯片制造，史无前例的战略失误 04/13/24
“中国天眼”又有新发现！ 04/13/24
重大突破！清华大学团队研发AI光芯片赋能大模型算力 04/13/24
台积电 2nm 工艺再曝，iPhone 17 Pro先用？ 04/11/24
年轻人也开始得帕金森病年轻人群发生与遗传因素密切相关 04/10/24
AI如何重塑存储业态？ 04/10/24
月球背面的“秘密”被揭开？中国卫星传回图像，原来霍金没说错 04/10/24
高维度外星人或许正“降维”穿越地球，哈佛教授警告：别再掉以轻心了 04/10/24
海洋中的活化石，生活在距今4亿年前，样貌极其独特，相当神秘 04/08/24
黑暗深海中能量与物质如何进行循环的？这些神秘微生物才是主导者 04/08/24
月下的蓝色海洋，神秘生物绽放绚丽的光芒，背后隐藏大量环境信息 04/08/24

>>>>查看更多楼主社区动态...