传蔚来重组智能驾驶研发部,感知与规控合并为大模型团队
6月19日消息,据晚点Auto了解到,蔚来智驾研发部近日完成架构调整。此前,蔚来智能驾驶研发部分为感知、规控和集成等部分。调整后,感知和规控团队合并为大模型团队,集成团队重组为交付团队。合并后的大模型团队由原蔚来感知团队负责人彭超负责。
重组后的自动驾驶研发部仍由蔚来智能驾驶研发副总裁任少卿负责。任少卿在这次调整后曾向团队传达:要放弃业界沿用多年的 “感知-决策-规控” 传统范式。这意味着蔚来将更明确地探索用端到端大模型实现高阶智能驾驶。
任少卿毕业于中国科学技术大学与微软亚洲研究院联合培养博士班,2015 年,他在微软亚研院与何恺明、张祥雨和孙剑一起发表了残差网络 ResNet,成为 ImageNet 图像分类比赛中的冠军模型。2018 年,任少卿参与创立 Momenta,任合伙人兼研发总监,2020 年加入蔚来。彭超硕士毕业于清华大学,曾任 Momenta 高级视觉算法工程师。
目前蔚来智驾团队约有 1500 人,对比其它公司规模相对精简。华为的智驾团队超 7000 人,比亚迪约有 4000 人、小鹏约为 3000 人,理想在上个月收缩智驾团队后,目前约有 800 人。
特斯拉在年初发布了 FSD v12 版本,效果惊艳,这让特斯拉使用的端到端大模型技术逐渐成为行业共识,中国更多车企开始尝试这一路线。
人开车是靠眼看,大脑判断,然后用手脚操控。智能驾驶系统的运行逻辑与此类似,它主要由感知、规划和控制模块组成:靠摄像头或雷达等传感器 “看到” 外部环境,靠软件系统判断怎么驾驶,最后靠控制车辆的转向系统、油门、刹车等完成驾驶动作。
端到端之前,智能驾驶系统,尤其是其中的规划与控制部分,需要依靠大量规则来编程,以应对各种场景,这还不是目前的 AI 主流方法,即深度神经网络。
所谓端到端,则是从输入端感知外部环境到输出端产生给油门和刹车等部件的控制指令的全过程,都由深度神经网络完成。这需要预先用大量驾驶行为数据训练出一个贯通感知和规控的 “大模型”。
自去年以来,智驾方案的主要赛点就是率先实现大规模的城区 NOA(Navigate on Pilot,领航辅助驾驶)。它能实现城区路段的点对点辅助驾驶,车辆可以自主超车、变道、通过路口等,接近于人能开的,智驾系统都能开。
端到端的主要好处就是能加速城区 NOA 等高阶智能驾驶功能的落地。因为它可以覆盖规则方法无法完全覆盖的长尾案例(corner case),让智能驾驶更好地适应各种环境和场景,而不需要一个个城市去 “开城”,降低了城区 NOA 的普及成本,缩短了普及周期。好的端到端智驾系统也能更好模拟人类司机的驾驶行为,体验会更舒适、丝滑。
在城区 NOA 功能的竞争中,以服务用户的数量看,此前智驾声势相对小的蔚来已逐渐追上。
4 月底,蔚来向用户推送了包含高速和城区 NOA 的全域领航辅助 NOP+(蔚来称 NOA 功能为 NOP)。据蔚来官方信息,该方案已覆盖了全国的高速路段和 726 座城市的城区路段,服务了近 26 万用户。
蔚来已经上车的方案的规控部分目前仍是基于规则的路线。蔚来此前称将在今年上半年上线基于端到端的主动安全功能(包含 AEB 自动刹车等)。据了解,蔚来最新的 Banyan 2.6.5 版本即将推送,将包含端到端 AEB功能。蔚来尚未宣布端到端的量产节点。
以覆盖区域看,华为的城区 NOA 进展最快,2 月,华为推送了 ADS 2.0 方案。它也不是一个完全的端到端架构,但华为称该方案已能支持用户在全国范围的任何路段激活点到点辅助驾驶。问界、智界、阿维塔等车型的高配版已使用了 ADS 2.0。
华为预计,8 月将量产全面切换到端到端架构的 ADS 3.0。
小鹏也是目前城区 NOA 功能铺得最广的车企之一,今年 5 月小鹏官方称实现了端到端网络的上车,小鹏的城区 NGP(小鹏称 NOA 功能为 NGP) 已覆盖了 300 多座城市,预计在今年三季度能覆盖全国。小鹏的端到端目前由感知大模型 XNet、规控大模型 XPlanner 和大语言模型 XBrain 三个模型组成,和由一个模型完成感知到规控流程仍有区别。
理想在本周开启了 AD Max 3.0 无图 NOA 体验报名通道,称在全国范围内可不限路段体验城市 NOA 等功能,共计招募了 9000 位尝鲜车主。理想官方称,预计今年底或明年初,会推出基于理想自研的端到端大模型的高阶智驾方案。
据了解,长城计划今年在三款车型上实现端到端智驾量产,该方案是与供应商元戎启行合作,后者也已和比亚迪达成相关合作。上汽智己也已向用户推送了端到端架构的无图高阶智驾方案,这些方案是与供应商 Momenta 合作。
1-5 月,蔚来累计交付新车 66217 辆,同比增长 51%。