亿兆体育-萝卜快跑大火后,AI智驾时代的千亿赛道创业机会
你的位置:亿兆体育 > 业务范围 > 萝卜快跑大火后,AI智驾时代的千亿赛道创业机会
萝卜快跑大火后,AI智驾时代的千亿赛道创业机会
发布日期:2024-08-11 12:39    点击次数:142

图片

似乎是一夜之间,无人驾驶突然火了。

7月,百度旗下的「萝卜快跑」的无人驾驶出租车在武汉大面积铺开,几乎每天都在制造新闻。

据报道,萝卜快跑单日单车峰值超20单,已与出租车平均日单量相近,且乘客体验更好、更舒适。从保险数据看,萝卜快跑的出险率仅为人类的1/14,目前安全行驶超过1亿公里,没有出现一例重大伤亡事故。

而大洋彼岸,马斯克也宣布将在8月发布特斯拉首款无人驾驶出租车Robotaxi(后推迟至10月),他表示车主可以在空闲时间将Robotaxi投入出租业务,两年内即可收回购车成本。

无独有偶,7月23日谷歌也宣布将对Waymo追加新一轮50亿美元的巨额投资,以“保持Waymo世界领先自动驾驶公司的地位”,要知道当年微软投资OpenAI也只花了10亿美元,50亿美元已经接近waymo历次融资的总和。

事实上,今天无人驾驶的爆发绝非偶然。站在业内视角,过去3年也是自动驾驶技术发展最快的3年,几乎可以说是“一日千里”。

从目前中美两国的进展来看,如果抛开立法标准和时间的羁绊,无人驾驶很可能将在未来1-2年内投入全面商用,在5-10年达到端到端的“完全体”,实现类似科幻电影中的无人驾驶形态。

从这个角度来说,虽然现在谈论无人驾驶的“iPhone 4时刻”或许还为时尚早,但无人驾驶的时代奇点的确已经到来。

与此同时,这也是一场与时间的赛跑:中美作为全球自动驾驶企业数量最多的两个国度,谁能率先跑通并建立起相关产业链,谁也就有了定义赛道、向其他国家输出技术产品的能力。

站在中美科技竞争的大背景下,这对任何一方来说,都是一场“输不起的战役”。

在本文中,我们将从自动驾驶的发展史入手,尝试来推测下行业未来的发展趋势。首先先分享几个初步结论:

1.从高精地图、激光雷达到BEV:自动驾驶的进化一切路径都是为了“让车的行为更像人”。

2.过去3年也是自动驾驶技术发展最快的3年,国内外大批玩家都已实现了不同程度的端到端,展望未来,最终达到整体端到端的终极形态也只是时间问题。

3.无论是纯视觉还是激光雷达路线,毫米波雷达都是弥补两者技术短板最好的手段,随着毫米波雷达从3D到4D再到成像毫米波雷达,不断提升的精度也让这个赛道拥有了诞生高价值公司的机会。

4. 自动驾驶的落地和商业化可能只是个开始,未来更多的赛道和产品(比如不同场景的机器人)在积累足够的数据之后,都可能复现类似的故事。

5. 纵观历史,每一次技术路线的迭代,都有一批创业公司崛起的机会,相信这次也不例外。

为什么说过去3年,是自动驾驶发展最快的3年?

自动驾驶公认的起源是2004年,当时的美国正深陷阿富汗和伊拉克的战争泥潭,急需一批军用无人载具来减少美军的伤亡,但研发进度始终不理想。

于是,时任美国国防部高级研究计划局(DARPA)局长托尼·特瑟突发奇想,搞出了一场挑战赛,宣布无论谁只要能用无人驾驶的方式,在10小时内从洛杉矶到达拉斯维加斯,就可以赢得100万美元奖金。

这实际上是一场美军针对民间的大型招标,主办方本来以为没什么人会参加,结果没想到有100多个团队报名,不过遗憾的是,最终没有一个人能拿走这笔奖金——因为最远的一辆参赛车也只行驶了12公里,约等于整个的赛程的5%。

(图:当时参赛的除了汽车,还有自动驾驶摩托车……)

但DARPA并未放弃,又在2005-2007年连续举办了3届自动驾驶挑战赛,吸引了无数大学和企业的研究团队投入其中,这也让谷歌创始人之一的拉里佩奇看到了自动驾驶的潜力。

2009年,在佩奇的推动下,谷歌自动驾驶项目「Chauffeur」正式启动,招募的两位核心工程师(安东尼·莱万多夫斯基与塞巴斯蒂安·特龙)都曾是DARPA的参赛选手,这两个人后来也为了谷歌自动驾驶部门的开创者。

到2014年,谷歌发布了全球第一辆没有方向盘和油门踏板的全自动驾驶汽车Firefly,不仅震撼了汽车界,也让全世界首次意识到了自动驾驶实现的可能性。

(图:Google自研的第一代无人驾驶汽车Firefly)

紧跟着,大笔风险投资开始涌入无人驾驶赛道:从Uber、英伟达、亚马逊,到百度、滴滴、华为,再到奔驰、宝马、通用、本田,包括国内的造车新势力们,纷纷开始了对自动的驾驶研发的投入,今天我们耳熟能详自动驾驶公司也大多创立于那时。

时间很快来到2年之后,对自动驾驶的行业来说,2016是个极其重要的年份——因为这一年,特斯拉正式加入了战局。

不夸张的说,以2016年为分界线,整个自动驾驶的下半场,就是一部特斯拉从一个行业追赶者,逐渐变成引领者的逆袭史,所以个人觉得,怎样去渲染这个时点都不过分。

在2016年之前,几乎所有自动驾驶公司都选择了谷歌的技术方案:

1)定位:以高精度地图的辅助定位;

2)感知:用激光雷达+视觉摄像头为车辆提供感知信息;

3)规控:基于rule based算法做决策和控制。

不难发现,谷歌方案的底层逻辑是「叠甲」,所谓“有总比没有好、多总比少好”。

这一派认为,以目前的技术水平,没有一个单一传感器能够完成自动驾驶所需的全部功能,或者说覆盖所有corner case,因此需要利用所有传感器来综合进行自动驾驶决策,给不同的传感器分配不同的权重;而这其中,激光雷达的权重又是最高的,所以这一派的解决方案也被称为「激光雷达方案」;本质上,这是一条硬件为主的技术路线。

而作为AI起家的科技公司,特斯拉则更看重软件,比如马斯克就觉得当时的激光雷达太贵了,要8万美元一个,所以他把更多的精力放在研发强大的视觉算法及专用AI芯片,试图借助摄像头对周边物体建立模型,并把数据添加至神经网络进行计算,慢慢发展出了「纯视觉方案」这条偏软件的技术路径。

用马斯克自己的话说,“人和动物都长眼睛,而不是雷达“,命运的齿轮也由此开始转动。

在当时来看,两条技术路线各有千秋:激光雷达虽然硬件成本高,但天生精度高、且具备深度信息(直到今天,很多工程师依然对激光雷达情有独钟);而摄像头虽然便宜,但分辨能力有限,只能在二维世界里通过物体一个面的信息努力做对照,通过计算与转化得来的情报总归不如一手信息来得准确和直观。

这也导致特斯拉一度自建了上千人的标注团队,所以当时很多人就质疑马斯克,说你硬件虽然便宜了,但综合成本算下来还不如激光雷达。

其实从这里也能看出,当时整个自动驾驶的AI程度几乎等于没有(除了lidar稍微有一些ai算法),属于典型的“有多少人工,就有多少智能”,如果AI的发展就此止步,那么特斯拉的纯视觉方案大概率也会遭遇瓶颈。

不过最终,拯救特斯拉的还是谷歌:

2019年,谷歌发表了那篇著名的Transformer论文(也是后来大模型的基础)。

虽然Transformer是一种基于注意力机制的神经网络模型,但特斯拉的工程师很快发现,Transformer不仅可以处理语言信息,也可以用于处理图像信息。

简言之,Transformer能够把特斯拉8个摄像头收集到的信息,融合到同一套定位坐标体系中,相当于让汽车获得了“上帝视角”(即BEV,“鸟瞰图”),能够看到周围环境的3D信息。

(图:BEV技术让特斯拉有了“上帝视角”)

2021年的AI day上,特斯拉发布并成功带火了BEV,从2022年下半年开始,国内玩家也纷纷宣布跟进,并逐渐开始实现BEV上车。

(所以说,虽然很多技术并非特斯拉原创,但它把前沿探索的先进理论工程化并实际落地应用的能力,绝对是宇宙级别。)

与此同时,特斯拉也开始尝试将标注过程尽可能自动化,来解决成本太高的问题。

它的原理有点像玩猜字谜:首先,车载摄像头在看到某个物体后(比如一棵树),会把信息上传到云端的大模型,然后由大模型来“猜”这个物体是什么?如果猜测的结果与8个传感器的呈现一致,那么这棵树就将被自动标注。

如此一来,特斯拉就摆脱了人力的限制,只要车辆能不断发回路面信息,它就能够无限量地训练自己的算法。

到此为止,特斯拉的表现已经足够惊艳,但仅仅一年之后,马斯克又在 AI day上放了两个大招,第一是引入了时空序列,第二是引入了占用网络。

简单来说,前者让汽车拥有了对于时间的记忆能力,后者则实现了类似「伪激光雷达」的效果,让汽车在不识别该物体是什么的情况下计算空间位置并判断是否需要进行避障,解决了之前“撞上白色大货车”的问题。

至此,不论路径单从效果而言,视觉方案已经达到了与雷达方案基本一样的效果。BEV+Transformer成功实现了自动驾驶感知技术的路径收敛,也形成了今天视觉感知算法的基础框架。

(图:占用网络实现了类似「伪激光雷达」的效果)

所以大趋势上,自动驾驶的进化路径其实是非常清晰的:一切目的都是为了让车的行为更像人,让AI可以通过前面发生过什么,预测未来将会发生什么。

从这个角度来看,过去3年其实也是自动驾驶技术发展最快的3年,而AI也在自动驾驶里逐渐展现出强大的升级迭代能力;但当时的普通人大多对此了解不深,以为自动驾驶没什么进展。

真正让大众意识到AI对自动驾驶行业产生革命性影响的,还是2023年发生的几件事:

·马斯克首次在社交平台上提到“v12 is reserved for when FSD is end-to-end AI”让端到端出现在大众视野中(16年英伟达就提出过但影响力不大),无数人开始期待v12的发布;

·CVPR近十年来首次将best paper颁发给一个中国团队、褒奖其在实现端到端自动驾驶上做出的贡献;

·马斯克坐着一辆搭载了v12测试版的model S做了一次45分钟直播、全程仅干预一次,效果可以说非常不错。

不过也需要明确的是,目前尚无任何直接证据证明特斯拉展示的v12实现了完全的端到端,只是其展示的效果确实非常惊艳,智能化程度基本可以与人类老司机媲美。

事实上,如果将自动驾驶系统按传统的理解分为感知、规划和控制,目前各大主机厂用于秀肌肉的主要还是部分AI+基础规则约束的模块化端到端。

而由于每个模块间需要人为定义接口,在这个过程中会损失部分信息,所以模块越多,意味着损失的信息也越多,未来如何把所有模块统一到一个模型之中,各大厂商还需要继续努力。

不过,从我们收集到的信息来看,按照目前技术和工程化的发展速度,自动驾驶最终实现整体端到端也只是时间问题,对此,我个人相对保守的预测仍然需要3-5年左右的积累。

到那时,车辆就可以根据实时收集到的路面信息,在「黑盒」状态下完成驾驶决策,直接输出刹车、转向等控制信号,实现类似于科幻电影中的无人驾驶终极形态。

(图:自动驾驶的五个发展阶段,资料来源:险峰长青)

无人驾驶迭代带来的创投机遇

为什么无人驾驶在此时爆发?本质来说,我们感受到的无人驾驶的“跃进”式发展,只是这一波AI热潮的大背景下、从model-base到learning-base范式转移的具体表现之一,但为什么它能最先起来?

原因非常复杂,这里仅仅讨论三个我认为的关键要素:

一是数据相对丰富。

众所周知,“出行”是个高频需求,国内无人驾驶行业从2015年前后开始兴起,到今天已经有差不多10年时间;这期间,主机厂和智驾公司收集到的数据,不论质量的好坏,至少在总量上已经足够丰富,这就为后来实现数据闭环创造了基础条件。

二是功能定义相对清晰明确。

坦白讲,虽然这一波AI的概念很热,但其实很多产品的发展方向都是不明确的。

比如说人形机器人,很多公司只是做出了一个样品,可以在展会上进行演示,但放到实际的工业场景中,这些机器人到底能解决什么问题、做到什么程度,上游技术端其实是不清楚的。

而下游工厂端因为不懂AI,往往也不知道这些机器人能实现什么功能、是否可以和其他技术进行组合,双方仅仅是拉平理解,就需要花费很长时间。

但无人驾驶却不存在这个问题,车辆只有前进后退转弯加速刹车这几个动作,就可以覆盖所有驾驶场景的基础行为,AI只要能做好这些就足够了,需求简单明了。

所以,从先进的技术转化到好用的产品,有一个明确的功能定义和标准划分也是必不可少的因素。

三是硬件基础相对成熟。

无论是激光、摄像头、以及毫米波等传感器方案,还是提供信号传递和处理的各类芯片,在经过这10年的充分“内卷”后,基本都已进入高性价比+稳定供货的阶段。

因此,在数据、硬件、技术三者螺旋上升的过程中,自动驾驶率先到达了那个价格和体验的平衡点,也就很快形成了新的生产力。

所以,如果沿着这个逻辑再向前推一步,自动驾驶很可能也只是个开始,未来更多的赛道都有可能复现类似的故事。

当然,前提是这个领域中要出现一些公司,能够持续以低成本的收集到大量数据(类似于自动驾驶中滴滴、百度、特斯拉这样的企业),而不是只靠一些零散的小数据,这可能是我们判断某个行业是否出现类似拐点的一个基础。

换个角度来说,借助这波大模型的崛起,很多可以被AI自动化、但尚未有大公司跑出来的细分领域(比如低空经济、工业制造相关),未来可能都存在着系统性的投资机会,潜伏着百亿甚至千亿级别的科技上市公司,同样也值得广大投资人关注。

自动驾驶还有哪些可以投?刚刚稍微发散了一下,现在让我们把思维拉回来,还是聊聊自动驾驶本身。纵观历史,其实每一次自动驾驶技术路线的迭代,都有一批创业公司崛起的机会。

比如谷歌时代的主流方案是激光雷达+摄像头+高精地图,但今天高精度地图在乘用车上的使用频率越来越低,甚至不再被提起(想想也不过才是两年前的事情)。

因为当时,光一辆地图采集车的成本就上百万,如果要尽可能保证实时性,那么每天至少要保证几百辆车同时在路上跑,才能满足全国地图的实时采集与更新,这是任何车企或地图商都无法承受的。

结果就是产业机会最终落在了激光雷达上面:

首先是硬件厂商的崛起,比如禾赛速腾,再后来出现了文远、小马、Vimo等一批围绕着激光雷达做算法的公司,紧跟着是一批创业者开始基于雷达+封闭场景,尝试小范围闭环一些L4级别自动驾驶的应用,出现了各种各样的矿山无人车、港区无人车、酒店送餐机器人等等,整个自动驾驶的生态开始慢慢开枝散叶。

但特斯拉用BEV+Transformer再次颠覆了行业,证明即使没有雷达,同样可以实现对3D空间的判断。这时,激光雷达就变得和当年的高精地图一样,不再是一个必选项。

当然,今天激光雷达的价格已经降到了千元级别,并且很可能会继续下降,因此短期内,部分车企依然会采用多传感器融合的方案。

但是基于降本逻辑,在主机厂们“每一分钱都要卷到极致”的当下,激光雷达未来一定会逐步被纯视觉方案取代,整个产业生态格局也必然会随之改变。

比如,传统的毫米波雷达只能获取平面的信息,下一代可以探测高度信息的4D毫米波雷达的方向已经出现,我们看到的一些hints包括但不限于:产品层面伴随着芯片公司的多片级联、SoC方案为高精度、低成本方案铺路;产业需求层面oem对国产自主可控方案的渴望和尝试;高阶智驾产品对安全性、冗余要求的提升等等。

总之,在种种需求的合力推动之下,这个垂类中很可能会有一些新玩家跑出来。

再比如,随着摄像头收集到的信息越来越多、质量越来越高,由此又衍生出了对超算中心、端侧大算力处理芯片的需求,包括下一代端侧芯片,也不只是单纯的堆算力,而是要结合不同的算法架构,让两者更好地实现适配,这些都是硬件端带来的新变化。

而在偏软的方向上,我们则会关注那些低成本+高质量+可持续的数据获得/生产方式。

在端到端的路线下,learning-base的算法使用数据作为燃料驱动已经是事实,比如特斯拉的V12就被披露“已使用了一万块H100,已完成约1000万个视频训练。”

“这些视频来自每天从全球200万台可收集数据的实车收集的1600亿帧视频,而其中不到1%的视频是可用的,比如一些奇怪和异常繁忙的十字路口数据。”

作为第一个吃螃蟹的人,马斯克已经向业界交了一份足够优秀的答卷,那么接下来到底是通过影子模式、仿真引擎、亦或者world model的方式来获得高质量的数据,似乎就成了业界下一个需要探索共识的问题。

不过,我认为这已经无法单纯由某一个环节的公司来决定:尽管技术路线固然重要,但产业定位和商业模式,或许才是现在这个环境下,中国公司必须要做的前置思考。

总而言之,随着高阶智驾的落地逐渐升级换代,感知、传输、决策、执行、交互一定都会出现一些新的产业机会。

比如我最近和一些车圈创始人交流,发现大家除了各自的主业之外,也都在关注一些跨领域应用的技术和产品,很多意想不到的、跨行业的先进技术,最后都成为了他们的潜在友商和合作伙伴。

这说明,当行业内部竞争已经到达一定程度,只靠规模扩张+改进供应链很难获得足够的利润空间时,企业就必须要向新技术寻求新的突破点,内卷的尽头最终还是要靠科技发展突出重围。

限于篇幅,文末简单整理了一个表格,管中窥豹,来尝试拆解AI智驾时代的创业机会,希望能给你带来不一样的思考角度。

(图:自动驾驶不同阶段带来的产业变化与机会,资料来源:险峰长青)



相关资讯