为使智能辅助驾驶系统更趋近人类驾驶,各大厂商纷纷引入大模型技术,但选择了不同的技术路径。
理想汽车坚定地选择了VLA技术路线,强调语言模型在智能辅助驾驶中的重要性。通过语言大模型对视觉感知到的物理世界进行理解,并向执行模块输出指令。
这一过程在车端形成了思维链,具备类似人类的认知、推理和沟通能力。理想还基于这一技术开发了“理想同学”Agent,用户可以通过语音指令操控它完成驾驶动作。
华为则明确拒绝VLA路线,采用WEWA架构,利用世界模型实现对信息的全景理解,强调“去语言化”,直接实现“感知到行动”的闭环。
特斯拉FSD则采用最简单的纯视觉硬件,将端到端的技术发挥到极致,实现了全场景可用,一直是行业标杆。然而,在国内市场,其使用体验仍存在一定折扣。
这三种理念,谁更适应国内复杂多变的交通环境?
通过对比理想i8、问界M8与特斯拉Model Y,我们可以了解不同技术路线在“车位到车位”场景中的表现差异。
三车版本如下:
车位
要实现“车位到车位”的全场景领航辅助,车辆必须具备进出园区并在园区内自主寻找车位的能力。
过去,行业普遍采用“记忆泊车”方案,需要提前建图,车主需先手动驾驶一遍,让系统记录路线与环境信息。
如今,这三款车型的辅助驾驶系统已能应对陌生停车场,无需车主预先建图,即可实现自主进出。
其中,理想i8和特斯拉Model Y采用“漫游”方式,即一边用感知系统认路,一边寻找车位。
理想i8在目标停车场附近切换至漫游状态,通过闸机进入园区后就近泊车,从发现空位到停好车全程不超过50秒。
出停车场时,理想i8可以从车位上原地开启功能,为了调整车身还进行了倒车脱困,顺利出园区汇入主路。
在相同环境下,特斯拉Model Y的漫游功能出现了一些异常动作,可能是受闸机处的竖杆影响。
出停车场时,特斯拉Model Y同样是从车位上原地开启功能,跟随地面路标指引,漫游到闸机。但在应该右转汇入主路时,它却抖动方向盘选择向左打,存在撞杆风险,因此驾驶员进行了干预。
问界M8的方式与这两款车型不同,它依赖“云图”,即华为在全国各地的停车场提前采图并上传云端,共享给所有车主。
如果目标停车场不在云图范围内,问界M8在入口处会降级为LCC状态,需要驾驶员手动开进去。
其优势在于,华为云图数量多且更新速度快。
如果目标停车场恰好有图,用户在设置导航时,可以直接选择具体车位。如果该位置被占用,车辆会继续漫游寻找车位,全程无停车焦虑。
总结:找车位时,问界M8凭借云端地图,在覆盖区域内表现出预知能力,即使初到陌生地点也能从容应对。而理想与特斯拉则完全依赖车辆的实时感知,不受地图限制,其中理想在实时找路能力上表现更为出色。
行车
再来比较理想i8、问界M8与特斯拉Model Y在公开道路上的表现。三车在以下几个方面表现出明显差距:
首先是掉头场景。
理想i8是三款车型中唯一能够实现三点掉头的车型,当转弯受困时,它会倒车调整车身,因此即使在较为狭窄的主路也能完成掉头。
其次是特殊车道。
对于潮汐车道和可变车道等特殊车道,目前只有理想i8和问界M8能够识别,特斯拉Model Y尚未经过相关训练,无法识别这些规则。
最后是文字指示牌路口。在这种场景中,语言模型在智能辅助驾驶中的独特作用得以体现。
当路口的文字指示牌变为“直行车辆请进入待行区”时,只有配备了语言大模型的理想i8能够立即识别并进入待行区,而另外两车均无反应。
交互
从交互体验来看,配备了语言大模型的理想i8与问界M8、特斯拉Model Y有两点显著不同:
第一,系统具备动作可解释性。系统会在中控屏上显示其感知到的内容和每个动作的原因,使用户不再觉得某些动作奇怪,且在出现错误时能够了解原因。不过,文字信息略显密集,建议简化以提高可读性。
第二,理想i8支持语音控车。
系统不仅能听懂指令,还会根据当前情况判断是否适合执行。用户可以在停车场里通过语音指令让车辆泊入车位,或者直接说“停去电梯口”,即使小小的电梯间标志也难不倒理想i8的感知系统。
最后





