继“全国都能开”后,“车位到车位”成为智驾最新的评价标准。
具体分两个维度,即“有没有”和“强不强”,就此区隔强者与恒强者的身份。
“车位到车位”到底在谈论什么
端到端实现后,比拼的关键在于用户体验。
从营销视角着眼,用户体验是一个很笼统的词,车企/供应商需要借助一个强有力的论据,让用户看到击穿痛点的价值。
由此,各“玩家”盯上了“车位到车位”。
如果说,此前“全国都能开”是从面上证明开城规模广,那么现在的“车位到车位”就是从点上明确使用价值高,把“从A点开到B点”的底层逻辑映射到现实层面。
在华为打出样本之后,小鹏、理想、极氪、小米都心照不宣地将“车位到车位”提上日程。
大洋彼岸的特斯拉,最近也将“车位到车位”功能更新到智驾最新版本FSD V13.2中。
我们试图从6名“玩家”对于这一功能的叙述中,解读其背后的隐含意义,主要有三点。
一是全场景覆盖。“车位到车位”打通了停车场到公开道路、公开道路到园区、园区地面到地下车库等多种场景。其中,“过闸机”能力成为表述关键词。
二是应对复杂路况。在“车位到车位”的语境中,强调了智驾应对复杂路况的连贯性与完整性。
三是连接泊车功能。车企在自动泊车能力上已经卷到了厘米、分秒级别。现在,在“车位到车位”的应用场景中,这种出色的泊车能力与车辆行驶之间没有断点。用户坐进车内,就可以启动智驾,系统可以让自动驾驶与泊车无缝协作,到达下一个车位。
暗流交相涌动
当各家车企都亮出“车位到车位”大招时,如何评判功能优劣的问题接踵而至。
理想汽车技术专家文治宇曾一针见血地指出,“车位到车位”做得好不好,主要看两个核心要素。
一是体验连贯性,即在启动这个功能前,是否需要多次学习;学习完成后,能否立即开启使用。二是产品完整性,即对于一些复杂起步场景,如多层车库是否能够驾驭,做到全程无断点。
围绕这两点,把目前这些“玩家”的“车位到车位”功能放进审视场域中,可以明显看到共性与差异。
共性在于,无论是内测还是全量推送,目前国内“玩家”在地库、封闭停车场场景中,由于没有导航信息,需要先由用户跑“图”。
具体建图方式还不一致,有“玩家”要求车辆把地库所有路线全部跑一遍,相当于给地库建一次全面、清晰的地图后,方可使用“车位到车位”。
另一种思路是,用户仅需按照系统要求,完成从起点到目的地的车位驶入进口、驶出出口的路线学习,即可启动该功能。
当然,系统也会结合用户日常驾驶路线数据,通过静默学习,自动生成通勤路线的“车位到车位”。
所以,唯一区分点在于“车位到车位”功能能否适用于初次行驶场景,即用户在陌生路段不建图,也能全程使用智驾功能。
目前,似乎只有特斯拉做到了。
在国外用户实测FSD V13.2版本的视频中,用户把车辆开进多楼层,甚至标识不清晰的停车场顶楼后,故意绕了很多圈迷惑FSD。但是,开启智驾功能后,系统在未提前学习路线的情况下,没有出现无目的绕圈、跟车行为,而是很快找到正确路线,并从出口处驶离停车场。
另一个差异点是玩家对于“车位到车位”的具体解题思路不一致:一派以理想为代表,遵循“VPA+NOA+VPA”的技术路径。即在停车场路段,驱动系统行驶的是记忆泊车/代客泊车模式;驶入公开道路后,立刻转变为智驾领航模式。
另一派以特斯拉、小鹏为代表,用一套模式打通全场景。即无论是在园区封闭路段、地下停车场区域还是公开路段,环境感知界面一直保持智驾NOA画面,不会随场景变化切换软件系统。
行泊一体的逻辑,还使得小鹏智驾系统在封闭场景及停车场区域,可以更好地应对绕柱、避障、极窄通道会车、连续急弯等场景。而且相比两套模型,一套模型的更新、维护在成本、效率上似乎是更优解。
总之,尽管目前特斯拉FSD V13.2内测版本看似领先一步,但距离其入华还有一段时间。
在此期间,国内“玩家”的技术飞轮正在疯狂转动,不断优化“车位到车位”功能,更新到全量推送的版本上。在真正同台竞技的时刻到来之前,胜负依然未定。
端到端进化到2.0时代
“车位到车位”,可以看作各“玩家”对于“端到端”方法论的具体演绎。
“端到端”上车,本就指向了AI系统拥有类人驾驶的能力,一张神经大网囊括了从感知到执行所有模块,从而在应对极端场景时,不再被生硬的规则控制,而是像人类司机一样观察、思考、决策、执行。这反映到“车位到车位”的实际场景中,系统可以应对各类极端情况,驾驶水平愈发出色,由此构成了技术-应用的完整闭环。
在数据闭环迭代过程中,“端到端”技术演化到了2.0阶段。
这时,投身于端到端浪潮的头部“玩家”从路径收敛走到了路径分野的十字路口。
一边从感知规控模块划分,“两段式端到端”向“一段式端到端”奔涌。
前者将感知模块视为一段,预测到决策模块视为另一段;后者则是将感知到执行端到端模块全部打通。
“两段式端到端”典型代表是华为乾崑ADS3.0,由“GOD+PDP”网络组成,GOD网络负责感知、识别障碍物,PDP网络则根据感知信息迅速做出决策。
而“一段式端到端”主要“玩家”有Momenta、商汤科技等,将感知端到端到执行端到端集成到一个大模型中,使系统能够更直接、高效地处理信息并作出反应。
一段式端到端是两段式端到端的进化形态,由于其打通从感知到端到端所有环节,使得模型感知信息更准确,执行反应可以更加顺畅、灵活,智驾水平更强。
另一边从技术路线思考,“端到端+VLM”开始向“VLA”路径迭代。
理想以“快慢系统”理论为基础,先设计出一套“端到端+VLM(视觉语言大模型)”系统。
两个模型分工协作,端到端模型基于快思考,负责处理常规的驾驶行为;VLM模型通过慢思考,应对高难度的极端场景。
而VLA模型是近期走上技术路线的关键词,由元戎启行率先提出。VLA即视觉-语言-动作模型。显然,从名称中可以发现,它是“端到端+VLM”系统的一整个融合体。
这种一体化方式,使系统接收到数据后,不再由“快慢”系统进行多次交互与调整,而是一次性生成最终驾驶指令,提高信息处理、决策的效率,并能够应对一些更具挑战性的长尾场景,如几十秒路况的长时序推理等。
事实上,无论是“一段式端到端”还是“VLA”模型的新型进化,背后都是对AI资源的进一步消耗。
模型参数越大,对硬件算力、数据闭环的迭代能力要求越高。据悉,部署VLA模型,对芯片算力等级直接来到了NVIDA DRIVE Thor,算力高达1000+TOPS。
资源战打响后,智驾第一梯队与其他“玩家”的分水岭变得更大了。
在端到端2.0时代,性能体验与成本都在朝不同方向无限延伸:性能走向高处,“车位到车位”成为衡量智驾水平的核心维度;成本走向低处,高阶智驾正快速落实到20万元以内的新车。
其他智驾玩家在前后夹击下,“性价比”的担子更重了。
这也意味着智驾“第一梯队”走得越来越快,掌握了更多资源,一场马太效应正在行业悄悄蓄势。
市场很现实,如果不想被规则淘汰,那就只能改写规则。(文章来源:第一电动网)