首页 > 汽车技术

特斯拉自动驾驶仪3D技术将成为即将爆发的新引擎

2022-11-01 15:05:05来源:   汽车技术 编辑:众创汽车资讯网

摘要

1. 特斯拉即将发布的3D更新将增加AI辅助驾驶功能。

2. 未能意识到特斯拉在自动驾驶技术上的竞争优势的分析师和投资者,将会突然觉醒。

3.大多数金融模型仍将特斯拉视为传统的 汽车 制造商,但这在未来将不再适用。

分析师和投资者系统性地低估了特斯拉(Tesla)在自动驾驶领域的竞争地位。对竞争环境的评估过于依赖于对演示视频中自动驾驶 汽车 性能的定性判断,以及其他公关、营销和品牌塑造活动。从 历史 上看,被指派到特斯拉的卖方分析师大多是 汽车 分析师,这意味着他们没有时间或精力深度学习和研究机器人技术。这意味着特斯拉的自主优势正在被低估,或者根本无法在市场上定价。


在我撰写关于特斯拉的文章的三年中,我一直坚持认为数据规模比几乎所有其他事情都重要。我也一次又一次地指出,认为特斯拉在自动驾驶方面的进展将是平稳而持续的,而不是磕磕绊绊、断断续续的。我推测,深度学习研发有两个阶段。数据收集和标记阶段可能相对快速。速度取决于公司在野外拥有的机器人数量以及它雇佣的数据标签工人数量。


接下来是一个缓慢而不可预测的阶段,人工智能科学家和工程师致力于构建一个系统,以适当的时间、合适的力度摄取标签数据并输出有用的机器人行为,比如转向、加速和刹车。获取数据就像给油箱加油。AI科学家和工程师的工作就像制造引擎一样。从里程表的角度来看,进展可能是什么都没有,然后,在一瞬间,点火开关被打开, 汽车 就启动了。


AI非线性发展的一个显著例子就是OpenAI在经典视频 游戏 Montezuma's Revenge上的突破。这张图表说明了一切:



在这种情况下,数据是从 游戏 中收集并自动标记,因此数据集创建阶段要比科学和工程阶段快得多。此外,蒙特祖玛(Montezuma)的复仇在AI社区的整体进展也不是顺利和持续的。


特斯拉在路上有超过90万个机器人。在美国,其所有竞争对手的合计机器人数量不到2000辆,而且鉴于大多数测试都在美国进行,因此全球总数可能不会高很多。深度神经网络的性能可预测地随着数据的变化而变化,这样的数据优势可以产生2倍到30倍的性能优势。


一个重要的警告是,数据需要手动或自动地标记。正如我所写的那样,特斯拉有许多很有前途的选择来自动标记数据,并使用其庞大的车队来使手动数据标记更加高效。(也就是说,在同样的人力资源中获得更多的神经网络性能。)特斯拉的AI科学家和工程师面临的挑战是,寻求这些选择,并让它们在商业规模上像在概念的学术证明中那样发挥作用。换句话说,就是制造一个能使用充足的燃料运行的引擎。


走向3D


显然,特斯拉AI团队目前最重要的工作是将计算机视觉从2D范式转换为3D范式。埃隆・马斯克(Elon Musk)在特斯拉第三行播客中首次描述了这一概念:



马斯克最近详细阐述了这一转变所涉及的工作:


“Whole Mars

@WholeMarsBlog


回复@elonmusk @romanhistory1和@HardcoreHistory

自动驾驶仪的重写怎么样了?

你们叫它 PlaidNet么?


Elon Musk

@elonmusk

顺利。团队很出色,和他们一起工作是一种荣耀。几乎所有的东西都需要重写,包括我们的标签软件,所以从训练到推理的每一步都是“3D”的。

2020年7月2日凌晨4:54”

2020年7月2日

回复了@elonmusk @WholeMarsBlog和其他两个博客

反向召唤有什么更新吗?

Elon Musk

@elonmusk

当我们转换到新的软件栈时,许多功能将同时发生。最有可能的是,它将在2到4个月内发布。接下来的问题是,什么样的功能被证明足够安全,可以让用户使用。


从2D到3D的转变意味着什么?就我所能猜测到的来说,这与传感器数据表示为神经网络有关。


LiDAR激光脉冲通过在光线撞击物体并返回传感器时创建一个点来创建周围物体的3D表示。世界的3D表示称为点云。



2018年,来自康奈尔大学的计算机视觉研究人员(包括王燕和赵卫麟)发表了一份预印本,显示可以使用相机来创建3D点云,更重要的是,使用这种形式的表示方式不是2D图像提高了神经网络使用相机预测深度的能力。相机可以通过立体视觉获得点,这也是人类和其他哺乳动物在一定距离下感知深度的方式。事实证明,使LiDAR(激光雷达)如此有效的不仅仅在于激光器,还有将LiDAR(激光雷达)输入解析为点云的常见做法。Wang等人将利用相机生成点云的方法称为“伪LiDAR(激光雷达)”。自2018年以来,其他研究人员也在此基础上开展了研究。


如今,至少在某些学术基准上,伪LiDAR及其相关方法(如伪LiDAR ++和ViDAR(代表可视LiDAR或视频LiDAR))在3D对象检测和深度估计上与匹配LiDAR非常接近。据我了解,伪LiDAR ++的准确度大约是流行的KITTI Vision基准上LiDAR的三分之一。


今年早些时候,特斯拉的AI高级总监安德烈・卡帕西(Andrej Karpathy)公开透露,特斯拉目前正在研究一种用于深度估算的伪LiDAR方法。回到2019年的自治日(Autonomy Day ),卡帕西演示了通过立体视觉获得的3D深度信息:



在他最近的演讲中,Karpathy分享了3D表示与2D表示中获得的准确性的一小部分。这些可视化显示了路缘检测,左侧是“ground truth”(可能来自LiDAR),右侧是使用2D表示的基于摄像头的检测,中间是使用3D表示的基于摄像头的检测:



如果这一定性的结果真正代表了特斯拉的整体性能提升,那么3D更新必将给特斯拉的AI辅助驾驶软件带来巨大的改进。从外部来看,这种改善会出现突发性和断续性。


钱来了

谈到特斯拉和自治(autonomy)方面,大多数分析师和投资者采取的是“我看到就相信”的态度。当然,这是他们的权利,但在我看来,这意味着低估了特斯拉在2021年及以后的收益和现金流。在实现完全的自动驾驶之前,特斯拉将继续大力推进AI辅助驾驶。特斯拉已经可以在红绿灯和停车标志前自动停车:


AI辅助驾驶可以说是特斯拉使用者最喜欢的功能,也是特斯拉和其他 汽车 之间最明显的区别。与之竞争的 汽车 制造商在实施无线软件更新这样的基础技术方面进展缓慢,据我所知,还没有一家公司像特斯拉那样,公开宣布计划围绕其 汽车 生产建立一个深度学习渠道。我相信,2021年以后,差异化软件将为特斯拉 汽车 带来更多需求。


对于没有其他附加组件的Model 3 Standard Range Plus,售价8,000美元的“完全自动驾驶功能”选项为购买价格的17%。这是一笔高利润收入,因为下载软件的边际成本可以忽略不计。马斯克多次表示,随着功能的增加,价格将会上涨。此外,特斯拉计划以每月订购的形式销售该软件。这必将扩大客户基础。


AI辅助驾驶软件带来的收入不断增长,意味着分析师们应该考虑特斯拉的预期利润率,而不是仅与其业内同行进行比较。此外,特斯拉在软件方面的优势证明了乐观的增长假设。


摩根士丹利(Morgan Stanley)的亚当・乔纳斯(Adam Jonas)最近发布了特斯拉2030年 汽车 销量为600万辆的看涨预测,认为特斯拉的股价将上涨2070美元。在我看来,考虑到特斯拉正步入 汽车 公司与人工智能(AI)和机器人公司之间的灰色地带,这种2030年的销量水平是合理的。目前尚不清楚,竞争对手如何能将 汽车 制造能力、软件和人工智能能力迅速合并,以减缓特斯拉目前的高速增长轨迹。因此,即使股价在1400美元左右,我仍然认为该股仍有很大的上涨空间。


我们还可以考虑 汽车 销售以外的问题。我预计,在“3D更新”向客户推出后,会有更多的分析师和投资者开始认真考虑机器人(robotaxis)出租车。虽然鉴于这种不确定性,很难知道如何为机器人出租车(robotaxis)的机会定价。然而,私人市场投资者已经通过Waymo (GOOG, GOOGL)和Cruise (GM)成功做到了这一点。为什么特斯拉无法在公众市场上做到这一点呢?


注:我/我们是long TSLA。这篇文章是我自己写的,表达了我自己的观点。我没有因此得到补偿(除了寻求阿尔法)。我和本文中提到的任何公司都没有业务关系。


英文原文:

(未经同意,请勿转载)

标签:

版权声明

    转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢您的支持与理解。