「核心提示」

自动驾驶的尽头,是人工智能

马斯克最近有三次亮相,备受关注。

第一次是在2022年TED大会,这场在温哥华举办的活动最后一场访谈,留给了马斯克,他与TED主席克里斯·安德森对谈。

第二场是5月10日,马斯克在英国《金融时报》直播的汽车未来伦敦会议上接受记者彼得•坎贝尔的采访。

第三场是5月16日,马斯克在ALL-IN峰会上的访谈。



除去收购推特这个热门话题之外,马斯克访谈中透露出的一个话题,应该受到新能源汽车行业的关注,它就是自动驾驶。

从去年至今,美国国家公路交通安全管理局共收到350多起关于特斯拉出现“幻影制动”的投诉,调查仍在进行。而这些投诉,涉及到一个核心问题:自动驾驶。

上述三场亮相中,马斯克心目中的自动驾驶是什么样的?他实现自动驾驶的路径又是什么?未来的方向是什么?

1、马斯克:自动驾驶坑太多,但有信心今年突破

5年前在参加TED大会时,马斯克放话:他要在2022年将一辆汽车从洛杉矶开到纽约,“全程无人干预”。

马斯克说的这辆车,就是全自动驾驶(FSD,Full Self-Driving)车辆,但直到今年也没落地。

“我并不总是对的。”5年后,马斯克如此回答。

马斯克承认,自动驾驶里面的坑太多。

“你认为你已经解决了问题,你以为你掌握了问题的关键,然而,并没有!你只是撞了南墙。”马斯克说。

马斯克打比方:如果将自动驾驶研究绘制成图,那它看起来像一条对数曲线。



马斯克一点也不喜欢这种对数曲线:它起初以一种近乎垂直的方式上升,然后变缓,收获越来越少。

“自动驾驶前进的方向上,有很多虚假的黎明,你最终会逐渐靠近,你的进步最初是线性的,然后看起来是对数的。”马斯克说。

这像极了特斯拉的自动驾驶研发过程:大有希望,直线上升;好多坑要踩,缓慢增长;有的坑还在前方。



有没有办法,让对数曲线上升趋势不要那么快的变慢?

“我有信心,我们将在今年解决这个问题。”马斯克说。

就事故发生概率而言,马斯克有信心今年特斯拉的自动驾驶将超越人工驾驶。

“虽然(离我说的目标)又过了一年,自动驾驶还没有变成现实。但我认为,突破就在今年。”马斯克说。

马斯克的信心来自哪里?

据业内人士估计,特斯拉拥有的人工智能能力,对周围世界的理解力已获得“顿悟”式进展。

2、特斯拉自动驾驶:激进路线


一名软件工程师告诉《超源力》,自动驾驶的难点主要在于感知和决策规划,而特斯拉选择的是激进路线:纯视觉路线。

特斯拉自动驾驶走的是仿生路线:选择摄像头和硅基神经网络,类似眼睛和生物神经网络系统。

在马斯克的理解中,自动驾驶系统设计,要适应生物神经网络,就像人类的大脑和眼睛。也就是说,自动驾驶要解决的是现实世界的人工智能和视觉问题。

特斯拉没有选用激光雷达,使用了摄像头和毫米波雷达。

上述软件工程师指出,感知选用纯视觉路线,训练成本高,现实道路复杂,变化太多,这些对神经网络模型挑战极高。

有人指出,采用摄像头和毫米波雷达因为成本更低的原因。

“激光雷达目前确实贵,但长期看,仿生的视觉路线比雷达效果好。”上述工程师分析称,如果激光雷达成本大幅下降,不排除会成为特斯拉的辅助手段,但特斯拉不会用其替代视觉路线,因为视觉路线更难,有更大的研发增值空间,“这才是马斯克的个性”。

另外,自动驾驶决策规划模块,涉及人工智能。人在驾车的时候,会实时做出很多判断,这里面涉及到人类的逻辑思维能力,也就是人工智能深度学习要直面的问题。

不过,这样的选择符合马斯克特点:做出激进预测,激发身边人的雄心,推动问题解决。

特斯拉自动驾驶2014年落地,迭代飞速。

在视觉识别方面,特斯拉采用“8+1”仿生视觉配置:8颗摄像头和1颗毫米波雷达。

具体配置为:前视宽视野、主视野、窄视摄像头各一颗,两颗侧后视摄像头,两颗侧前视摄像头,一颗后视摄像头。

这样,前置摄像头组合视野为360度,最远测距250米。毫米波雷达可视范围160米。

从第一代产品Hardware 1 到Hardware 3,画面每秒传输帧数(FPS,每秒帧数越多,显示动作越流畅)从最初的55增至2300,可同时感知亮度及颜色,在探测有无障碍物基础上新增物体识别功能等。

而在算力方面,增长同样惊人。

特斯拉第一代产品的算力大约为0.26 TOPS,第三代产品算力已达144TOPS。

TOPS全称为Tera Operations Per Second,是评价处理器运算能力性能指标,1个TOPS代表处理器每秒钟可进行一万亿次操作。

目前,特斯拉公布的Hardware4,配置的高性能芯片算力将达到 432 TOPS,因采用芯片制程工艺提升至 7nm(纳米),综合判断,其算力可能突破 500 TOPS。

一个项目商用的逻辑程序一般是:先有理论突破,然后技术突破,做出接近预期的样品,最后完成工程化。

“只要能拿出来接近预期的样品,基本这事就有戏。”上述工程师告诉《超源力》,虽然硬件性能提升飞快,但是面对复杂路况,中间确实难度不小,还要走不少路踩不少坑。

特斯拉采用纯视觉方案,有自己的考量,它是基于百万量级的车队和百亿公里级别的真实路况数据,截至2020年4月,特斯拉累计上路行驶里程48亿公里。

“现在肯定不止这个量级的数据了。”上述软件工程师判断。

另外,在最近三场专访中,马斯克提到,Autopilot被困在一个局部最大值(Local Maximum)里面,要向上突破非常困难,因此必须升级。

有专家指出,原有Autopilot软件架构,处理的数据是不含时间坐标的2D图像数据。如果处理3D或者加上时间维度的4D数据,也就是从图像级处理跃迁到视频级处理,Autopilot原有软件和训练网络已无法胜任,Autopilot必须革命,所以马斯克决定重写Autopilot。

为了配合4D数据革命,Autopilot现有用于深度神经网络训练的基础设施变成了Dojo,就是用于神经网络训练的超级计算机。

Dojo,日语意为道场,专门用于大规模的图像和视频数据处理,每秒运算百亿亿次。马斯克说,Dojo如野兽一般。

需要注意的是,特斯拉Autopilot系统和FSD是两套独立开发的系统,前者针对L2/L3级自动驾驶,FSD目标是L4/L5级自动驾驶,两者相差一个代际。

3、马斯克面对事故阴影:我们会做正确的事

在三场专访中,马斯克都面临一个无法回避的问题:自动驾驶导致的车祸事故。美国国家公路交通安全管理局共收到350多起关于特斯拉出现“幻影制动”的投诉。

“我认为,我们的自动驾驶,实际上已经非常接近比人类更好的安全驾驶水平。我踩过很多坑,今年会实现它,我们离它真的不远了。”马斯克被问到这个问题时,停顿后如是说。

他建议评估自动驾驶效果最好方法是:观察测试项目和那些参与测试项目的人的视频,“你会发现,进展是显著的”。

“我们有信心,我们不仅仅达到人类的驾驶水平,我们还会远远超过人类的驾驶水平。”马斯克接着说,从受伤的因素看,我们最终可能比人类驾驶安全10倍。

为了提升自动驾驶安全性,那些在车祸中死去的人是值得付出的代价吗?

“我们从来没有说过这句话。”马斯克说,我们一直反复强调,你不能在不知情时打开使用自动驾驶。

“如果看一下死亡人数,每年的汽车死亡人数大约100万人,每年可能有 1000 万人受重伤。”马斯克坚持认为,就像那些没有意识到他们会撞车,或撞到行人,或撞到骑自行车的人,他们不知道其实自动驾驶救了他们。

“即使你救了 90% 原本要在车祸中丧生的人,但如果剩下 10% 的人因车祸去世,你仍然会被起诉。”马斯克说,什么是道德上正确的决定,我坚信善的真实性远超所谓对善的感知,我完全鄙视那些强调善的感知而忽视善的真实性的人。

马斯克的话,翻译过来就是:为善的实践,远远比对善的感知重要。

马斯克承认,为了探索,公司必须要承受压力,但“我们会做正确的事,并站稳脚跟。”

4、自动驾驶的未来:宇宙的尽头是机器人

认识到自动驾驶的尽头是人工智能,马斯克花了不少时间。

为了解决自动驾驶问题,马斯克认为,确实需要解决现实世界的人工智能问题。如果汽车解决了现实世界的人工智能问题,那这辆车就是一个四轮机器人。所以,马斯克说,今年特斯拉正在研发的最重要的产品可能是机器人。

“目前所缺少的要素,是足够的智能。缺少的元素基本上是现实世界的智能和扩大生产规模,这是特斯拉非常擅长的两件事。”马斯克说。

因此,特斯拉需要设计人形机器人所需的专用驱动器和传感器。

今年AI Day上,特斯拉抛出了一个身高1米72、名叫Tesla Bot的机器人,它代表特斯拉当下的所有新技术:采用Autopilot感知系统、FSD的计算系统、基于视觉的神经网络架构、自动标签识别能力和DOJO自学习系统。

在运动能力上,Tesla Bot目前还没达到波士顿动力那样堪比武僧的灵活程度。

特斯拉要造机器人擎天柱,马斯克说要生产机器人猫女郎。畅想2050年时,马斯克认为,到那时,大多数家庭都会拥有机器人,会有伙伴机器人。

“今年会有一个有趣的原型,可能明年就能生产一批成品,很可能至少两年内。”马斯克说,机器人成本会因为生产规模扩大而降低,可能比一辆汽车还低。

马斯克很烦监管,但他意识到,不能让这种四轮机器人不可控,“需要一个人工智能的监管机构,这对公共安全很重要”。

“我们已经开源代码,任何人都可以免费使用我们的专利。”马斯克说,我们申请专利,是为了防止其他人制造阻碍电动汽车进步的专利雷区。我们永远不会真正起诉任何免费使用我们专利的人。

马斯克清楚,其他车企可能对特斯拉的自动驾驶更感兴趣,“也许会有一些车企希望获得特斯拉自动驾驶的许可,我们对此持开放态度。”

“这将是一盘比汽车本身更大的棋。”马斯克在专访中说。