极简城区智驾,大疆车载挑战不可能三角
文 | 李安琪
编辑 | 李勤
从去年的 " 百城大战 ",到近期的 " 全国都能开 " 热潮,高阶的城区智能驾驶已经走到量产决战路口。
华为率先全量推送无图城区领航功能;小鹏也在全国 243 城稳步开放城区智驾;蔚来则招募了 2 万用户在全国 706 城、总计 72.5 万公里道路内测。
但正如电池行业的铁律:成本、性能与安全是不可能之三角,电池厂商往往需要做出取舍,才有机会在风云诡谲的产业中立足。
高阶智能驾驶也面临同样困境:高质量、低成本与大规模,几乎不可兼得。
目前,市面上城区智驾方案大多需要搭载 1 颗以上激光雷达、数颗毫米波雷达。蔚小理、华为等高阶智驾车型价格基本超出 20 万元。
至少在目前,高阶智驾还不是多数人的游戏。
而大疆车载试图在质量、成本、规模的三角中找到平衡。与华为不一样,大疆车载走的是低成本、极简硬件路线,主打 15 万元 + 市场。
3 月 30 日的开放日中,大疆车载就展示了仅依赖 7 颗摄像头、1 颗高通 100TOPS 算力芯片的无图、纯视觉城区智驾功能,成本 7000 元左右。这对高阶智驾的大规模普及,无疑是重要推进器。
但大疆车载的高阶智驾,此前几乎只存在于同行的口碑认证中、存在于量产定点数字里。平衡好三角难题,是大疆车载跻身第一梯队的前提。
高阶智驾普及,需要极简硬件
去年,华为问界、蔚小理掀起轰轰烈烈的智驾开城大战。然而,这场热闹只属于 20 万元以上的车型品牌,其余用户只能旁观这场热闹。
从乘联会零售数据来看,去年 2170 万汽车销量中,20 万元以上车型占比三成,而 10 万 -20 万元车型占比超一半,后者是更主流的市场。
对这个市场的主机厂而言,激光雷达、英伟达 Orin 芯片等高阶智驾硬件成本,是难以逾越的门槛。据了解,带有激光雷达的智驾方案成本基本在 1.5 万元以上,光是 1 颗激光雷达成本就达 3000 元。
如果高阶智驾要加速下沉,硬件成本是首要解决问题。
已经有玩家在考虑去掉激光雷达。比如小鹏汽车与滴滴合作主打 10 万 -15 万元市场的 "MONA" 项目,蔚来主打 20 万元以下市场的第二品牌 " 乐道汽车 ",都被传出取消激光雷达,转而搭载纯视觉智驾方案。
行业趋势也愈发明朗:20 万元以上车型,车企仍然会配置激光雷达、Orin 芯片等硬件,但在 20 万元以下市场,车企大概率会探索纯视觉智驾方案,取消激光雷达,实现硬件极简。
最重要的是,大洋彼岸的特斯拉,已经靠着纯视觉路线一路狂奔,进化速度惊人。
近日,特斯拉就向北美超百万用户提供为期一个月的免费 FSD(自动驾驶软件包)试用。马斯克要求交付中心在交车之前,必须向用户演示 FSD 功能。马斯克表示:" 很多人都没有意识到,FSD 的目前表现有多棒。"
特斯拉一直都是纯视觉路线的拥趸,车辆的传感器只有 8 颗摄像头与 12 颗超声波雷达。
但纯视觉道路并非生下来就在罗马。
2020 年之前,特斯拉也采用了传统的感知、决策、规划控制等多模块方案,方案的实现基本依赖于工程师们手写一行行代码制定的规则,来驯化自动驾驶车辆。脑力的天花板,决定了系统的天花板。
而 AI 大模型让特斯拉找到了纯视觉的正确打开方式。2021 年,特斯拉开始将基于 Transformer 的 BEV(鸟瞰图)技术引入感知领域,使得摄像头从 2D 图像转化为 3D 图景;随后特斯拉还推出了 Occupancy(占据栅格)等技术,来弥补纯视觉感知路面物体纵深不足的短板。
不仅如此,特斯拉还用 AI 神经网络模型取代工程师手写规则,重构规划控制环节,逐步形成自动驾驶端到端方案。
最近,特斯拉还取消了 "FSD Beta" 中的 "Beta"(意为测试版),更名为 "FSD ( Supervised ) "(即受监督的)。
FSD 在使用说明中的标志性话语是:FSD 将城市道路驾驶堆栈升级为单个端到端神经网络,该神经网络由数百万个视频片段训练而成,取代了超过 30 万行的 C++ 代码。
可以说,在国内玩家还在激辩激光雷达去留时,特斯拉 FSD 纯视觉已经在 AI 大模型浇灌下,一路绝尘而去了。随着百万用户限时免费试用,特斯拉 FSD,比以往任何时刻都接近自动驾驶。
大疆车载既要高质,又要低价
而大疆车载纯视觉路线,比特斯拉 FSD 还要简洁,甚至连超声波雷达都没有。
大疆车载率先抛弃了激光雷达,而是用一对前视双目摄像头,来感知路面障碍物的深度;传感器还包括 4 颗环视鱼眼摄 +1 颗后视单目摄像头。"7V 是我们在过去几年积累总结出来的,能够平衡性能和成本的智驾最优解。" 大疆车载工程师说道。
硬件底层,大疆车载则用了 1 颗高通智驾芯片 8650,整体算力达 100TOPS。有智驾行业人士告诉 36 氪,较之英伟达 Orin X,高通智驾芯片的性价比更高。借助自身的成本把控能力、高通智驾芯片性价比,大疆车载才有机会做到硬件极简。
硬件之外,大疆车载算法也有所升级。在高通芯片支持下,大疆车载将感知算法升级为基于 Transformer 的 BEV 模型、Occupancy(占据栅格)、在线道路拓扑构建等。
基于 Occupancy(占据栅格),大疆车载能够提升城区、高速、泊车场景的各类通用障碍物的避障、绕行能力。此前,同样走纯视觉路线的极越汽车,也提出了能够自适应全场景分辨率的 Occupancy 模型。
在去掉高精地图后,大疆车载也能实时构建道路拓扑信息,获知实时路网关系,帮助下游规划控制模型作出变道决策、左右转、绕行等决策。
除了感知大模型,大疆车载还研发了预测决策大模型。通过对人类司机的学习,可以解决路口等复杂场景的车辆轨迹预测问题。但大疆车载不会直接用 AI 输出控制车辆,而只是作为参考,最后仍有基于规则的策略保障车辆安全。
硬件极简和软件升级,让大疆有机会闯出一条 " 低价高质 " 赛道。
但大疆车载并不排斥采用更多传感器,而是支持车企选装毫米波雷达、超声波雷达等硬件。
未来,针对更高级的 L3 级自动驾驶,大疆车载内部还在预研 " 惯导三目及激光雷达总成 "。据大疆工程师介绍,目前激光雷达的特点是测距准,但生成点云图其实远没有视觉图像的纹理、色彩信息丰富;视觉信息丰富,但是对于远处车辆的朝向、速度把握不够精准。
而大疆车载的激光雷达与三目结合体,同时将两种不同传感器做原生硬件设计,保持时间、空间信息的一致。这样一来,大疆车载可以获得信息稠密、精度又高的点云图,可以应对城区道路密集车流等复杂挑战。
量产挑战,工程化是难题
但在国内复杂的城市道路复刻特斯拉的成果,大疆车载必须大胆预设,加倍测试。
毕竟在实际量产中,用户体验优化、全国各地测试、数据闭环系统搭建、持续训练与 OTA 升级等,才真正考验着智驾团队的工程能力。华为、蔚小理等,无一不是如此。
日前,36 氪汽车在深圳宝安区的城市道路上,体验到了大疆车载的智驾方案。一路上车流往来不息,货车、泥头车轰隆驶过,摩托车也穿梭在繁忙街头。
而大疆车载仅用摄像头,也能识别路口红绿灯、二 / 三轮车、路边障碍物等。混乱车流中,通过无保护左右转路口时,大疆车载也能避让斑马线内行人和非机动车。
但车辆与人的复杂博弈无处不在。比如红绿灯路口,一辆三轮车突出在人行道处,大疆车载的绕行也相对保守与谨慎。最终,三轮车师傅后退半步、我们手动接管车辆,这场对决才得以结束。
加塞场景也时有发生。面对这种情况,大疆车载的车辆有时判断与响应还不够及时,需要驾驶员保持高度警惕、随时接管车辆。
整体体验下来,大疆车载会积极避让动态车辆,但对于静态车辆的绕行,有时会犹豫不决,需要手动接管才能通过。对此,大疆车载向 36 氪解释,目前测试版本大概是量产水平 60% 左右,等到第三季度量产,软件规控策略会更加成熟,用户体验也会更好。" 内部也在研发带车尾灯识别的模型,对临停车辆的决策可以更好。" 有工程师表示。
数据也是智驾系统持续迭代的关键。此前据大疆车载负责人沈劭劼表示,今年大疆车载将有 20 多款车型上市,其中就包括城市高阶智驾方案。
随着海量数据回传,大疆车载也面临着海量数据训练的挑战。以及,未来如何与车企配合,持续向用户 OTA 升级软件,也是大疆车载需要细化的工程。
当然,行业高阶智驾方案的起步也都难免存在不足。特斯拉自 2020 年起向种子用户开放内测,逐步迭代 4 年,才在今年 3 月向百万用户免费限时推送。
沿着当前方案,大疆车载的智驾天花板足够高,但纯视觉之路也注定艰辛。大疆车载需要更多数据的滋养,垒筑地基,才有机会真正让高阶的城区智驾变成多数人的游戏。