7.7
深览指数
科技虎嗅·汽车商业评论··AI 生成

你准备好“用嘴开车”了吗?

本文以领克Z20因语音误判关闭大灯导致事故为切入点,剖析了当前智能汽车行业争相将语音交互接入智驾核心的浪潮与背后的安全隐忧。文章梳理了从传统座舱-智驾分立架构到舱驾一体、AI智能体的产业演进路线,对比了特斯拉与理想等车企的技术路径,并指出核心矛盾在于语音的概率性模型与智驾的确定性安全要求之间的鸿沟。作者判断,在L4级自动驾驶成熟之前,语音控车更多是增强体验而非替代,行业亟需建立统一的安全规范。

核心观点
  • 当前车企将语音交互接入智驾核心的浪潮,与语音系统缺乏精准语义理解能力之间的矛盾,导致安全漏洞频发,行业需在安全底线上进行理性反思。
  • 语音控车的最终形态是‘AI智能体’,但在L4级自动驾驶成熟前,其主要价值是增强交互效率,而非替代人类驾驶。
  1. 012025年2月25日,领克Z20车主语音关阅读灯,系统误判致大灯熄灭并撞上护栏,事后OTA修复。
  2. 02马斯克宣布特斯拉FSD将引入自然语言交互,以解决FSD V14版本中约85%的人工干预发生在寻找停车位阶段的问题。
  3. 03理想汽车的全场景语音控制支持在NOA状态下通过指令如“变道”“超越前车”进行驾驶决策。
  4. 04行业趋势从‘舱驾分立’走向‘舱驾一体’,理想汽车将自动驾驶团队并入软件本体团队,小鹏汽车合并自动驾驶与智能座舱中心。
  5. 05特斯拉采用‘云端派’,通过云端大模型理解意图避免直接干预底盘;理想汽车采用‘端侧融合派’,将语音意图直接加入智驾观测模型。
  6. 06地平线副总裁吕鹏指出,好的智驾系统不需要频繁语音干预,频繁指令说明系统不成熟;并强调‘域隔离’对防止意外问题的重要性。
  7. 07特斯拉AI负责人阿肖克·埃卢斯瓦米表示,车辆接入Grok后,距离‘完全集成的语音控制’尚有距离,需防范对抗性攻击。
  8. 082025年底的GB 7258修订征求意见稿要求灯光、挡位等涉安全操纵件必须为实体,但并未解决‘语音乱令’的主动风险问题。
反方 / 局限
  • 作者暗含的盲点:文章主要站在行业技术演进角度,对消费者端‘用嘴开车’可能带来的法律责任归属和保险理赔问题几乎未作探讨。
  • 文章虽提及‘双重确认’解决方案的笨拙(‘既然都要确认了,直接打转向灯岂不是更快’),但未深入探讨如何在效率与安全之间设计出更优的交互逻辑。
领克Z20特斯拉FSDGrok理想汽车小鹏汽车舱驾一体VLA模型吕鹏阿肖克·埃卢斯瓦米GB 7258
13 分钟 · 4 卡片 · 12 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问