蔚来汽车杨进:智能驾驶测试评价技术方面的研究成果
10月30-31日,2024汽车技术与装备发展论坛在苏州召开,政府领导,院士专家,装备、汽车及产业链企业高层齐聚,围绕“共筑汽车产业新质生产力”年度主题,聚焦新技术、新装备、新生态展开深入研讨,探索装备制造与汽车产业的融合发展路径。论坛由1场闭门会、1场开幕大会、2场特色活动和4场分论坛构成,搭建起国内首个聚焦“汽车技术与装备发展”领域的高端对接平台。其中,在2024汽车技术与装备发展论坛之IVISTA智能网联汽车论坛上,上海蔚来汽车有限公司自动驾驶研发测试部高级总监杨进发表了演讲。以下内容为现场发言实录:
各位嘉宾,各位领导,大家好!今天我介绍一下蔚来全域自动驾驶,以及背后支撑的测试体系。
我介绍一下蔚来全域自动驾驶整个的发展历程,2020年的10月蔚来在全国首个发布领航NOP,那么在2021年的1月份,斌哥开启全栈自研的ET7的发布标准。之前的标准还是半自研,整个实现全栈自研。
我们来看一下实际的用户里程,2020的Q4就是我们第一个Q智驾里程是0.181公里,大概1800万公里。到了今年Q1我们实现1.92亿公里的智驾里程大约提升11倍。
2023年的9月份我们从高速转城区迁移,开启全域自动驾驶的交付的开始。截至今年4月30日,我们其实已经完成了全域自动驾驶的整体的发布,我们看一下发布实际的功能的情况。
刚刚朱教授讲了在今年或者是在去年的时候,其实在全域自动驾驶方面还是有一个开城的概念,很多车企之间以城数作为ODD覆盖范围,所以在那个阶段大家比的就是开城的效率。
在今年4月份我们从开城的效率视角来看,首先我们覆盖的城市是726座,高速的验证里程是36万公里,而城区是84万公里,累计是120万公里。
数字本身大家可能没有体感,我简单说一下他背后支撑的测试能力,大概是一个什么样的规模。
从高速的视角36万公里还是比较好理解的,一般高速如果我们要覆盖所有的匝道,我们基本上要3-4倍的里程覆盖才能取得一个有效的ODD验证。
36万公里的示范,基本上我们要至少验证100万公里。100万公里是一个很大的数字,高速有个优势,平均每小时车辆的运行速度是比较快的,基本上8小时500公里的验证是没有问题的,那么我们以50辆车每辆车500公里的验证里程去验,那么100万的验证里程大概需要40天能验完,这是一个基本的车企,能够去做的实车交付的里程。
但是这个方式在城区基本上没有。城区你看这个里程85万公里,85万公里,城区本身的路况和道路结构复杂得多,如果一个标准的四个方向的路口,如果我们要做覆盖是有12条路径,所以基本上一个有效的覆盖,我们至少要膨胀10倍,也就是我们要做到85万公里的示范,至少要85万公里的验证,这是其一。
其二,城区本身验证的效率也低得多。8小时实车验证基本上只有150公里左右,这两个要素的叠加使得850万公里,如果你同样用50辆车去跑那基本上需要3.1年、1300多天才能完成,这几乎是不太可能完成的事。这个层面上一般是技术本身底层基座的提升,另外一方面是测试能力的提升。
这是今年我们发布的乐道,乐道和前面的车型最大的差异还是因为没有使用高精度雷达,它是全视觉的解决方案,配置的是单颗orin算力,大概256tops加上4D成像的毫米波雷达以及12颗摄像头。
我们前序NTR平台配置了4颗orin,大概1056tops,以及对应的高精度雷达,这其实是纯视觉的解决方案。
这块整个infrastructure大概分几层,下面是能力层、运营层、算法层和基座群体智能的算法。群体智能算法解析来说有三部分,第一块超算平台,第二块超级训练中心,第三块超级测试中心。我们介绍一下超级测试中心。
整个测试能力迭代的历程,这个东西简单来说分三阶段,最早有功能原型迭代然后一步步来。大概举了两个例子,主动安全和全域领航的城区的NOP。其实主动安全这个功能看起来比较简单,测试起来比较难,它主要难度在两方面:
第一块,事故的recall,哪些事故你应该用主动安全召回其实是能测的,因为你也不知道用户会发生什么样的事故,究竟在用户发生事故的时刻你有没有产生应急反应,这个是非常难测的,事故的recall往往缺乏真实。
常规的测试还是基于仿真来测的,或者是一些道路的经典场景,它能保证已知的场景是有效的,但未知的场景很难验证。
第二块,主动安全功能因为它刹车力度很大,基本上最大达到负10的加速度。在这种加速度下用户的体感是非常强烈的,所以它的误触发率也是大家需要极力避免的。现在主流车厂的误触发里程基本能做到10万公里以上误触发,10万公里的误触发是非常难测试的,你其实拿道路测试测的话,10万公里跑出来的结果根本没法自信,你跑50万公里也没有太大的意义,因为10万公里的误触发50万其实达不到有效的指标。
在主动安全我们初期还是拿数以10万量级实车的道路里程加上仿真测试跑的,接近20万仿真的道路里程。这个阶段它典型问题就是你跑出的指标和用户体验的指标差距会比较大,最多可以差4-10倍,你测试出来的指标和真正用户拿到的指标可能4-10倍的差异。这4-10倍差异主要体现在一个是场景差异,你测试的场景和用户场景究竟是不是一样。第二块你和用户之间对于危险场景认知完全不一样,我们测试的时候发现我们测试工程师包括安全员在测主动安全的时候,他触发频率非常低,实际因为那些驾驶员安全意识非常强,而用户一般开得很激进,这种情况下是很难模拟出来的,他们指标差异是数以倍级。
我们在第二阶段引用了实车加仿真和伴生的测试方法,伴生的测试方法其实就是最早特斯拉的影子模式,这种百万级伴生验证里程能有效验证它在10万量级误触发下有效触发指数,解决了用户和实际差异性。相对伴生的方式,它更多还是基于真实用户的体感看一致性。比如车上有两个域,一个叫功能域,用户有一些紧急接管,这个是我们能感知到的。再看伴生域上的被测程序有没有激发主动安全来看一致性,它其实能做到和用户场景1:1的一致性,同时它有比较大的里程验证,能够比较好解决主动安全误触发里程和场景一致性。
到第三阶段数据驱动,数据驱动模式比较好理解,就是因为整个应用框架或者开发的层面上已经从普通的规则式模式转向模型化加规则叠加的逻辑,它越来越需要大量数据。在规则化时代,你测试报了一个issue,其实你只要3-5个issue就行了,研发看这3-5个issue本质上有没有解决。
而到模型化的时代,3-5个issue根本不行,研发要解决这个问题可能需要膨胀1000倍,也就是1000条数据验证这个数据有没有效,以及训练这个数据在这些数据下表现有没有好。它其实对测试的要求,甚至对数据训练的要求更高。那么数据驱动的时代,我们把测试能力做了10倍以上的增强,通过千万量级伴生的验证,它产生的数据一方面反哺模型训练直接做模型训练,同时用来做验证。大家也担心一些ORfitting的方式,其实在这种伴生的验证下,因为它不是固定数据集,ORfitting对它的影响也是比较小的。
第三阶段实现是你跑出来的测试数据既能用来做模型训练,同时用来做测试结果的验证,把整个研发效率推到新的高度。
在全域领航视角,在这三个阶段也是同样的迭代,因为城区本身是过于复杂的。我们最开始实测加仿真阶段也遇到了一些挑战,我们测试出来的结果在一些低频的问题,比如闯红灯,闯红灯的概率大概百公里零点零几次,这种指标很难通过实车或者仿真跑出来。这种情况下我们引用了第二阶段,通过大里程的伴生,再看用户域和伴生域在同两套程序下应急是不是一致。
比如在用户域下,用户在红绿灯下已经停下,但伴生域被测程序发出向前前进的指令,表示你其实有闯红灯的趋势。这种情况下我们会一个伴生事件到云端去捕捉到测试的异常。通过一体化的数据,然后推进整个全域智能往前推进。
我们再看一下,整个测试体系其实分了几层,最上层是业务层和应用层。第二块测试能力在不同应用阶段的应用,包括研发自测、周期性CICD拦截,以及我们更多引用了一些用户级的测试,以及在输出视角和监控视角的应用。
随着模型化的应用,各大车企在用户级的测试上其实看得更加重要,因为这种模型化的程序在小批量的里程下很难看出来,尤其用户体验下,它对用户级的领航看得更加重要。
底层测试能力视角我们也分几大块:
第一块,基础实车测试,包含用户体验定义、场景定义、标签管理以及场景级的管理。
第二块,SIL仿真和台架机HIL仿真。
第三块,车端伴生群体智能验证能力。
在底基座测试能力下,包括底层场景化的能力,第二块仿真用的chek检查器能力。chek跑出数据我们要做分析,自动化全I级的能力。以及如果我们有这些能力,如何更好地支持车端做里程管理、ODD管理以及对量产用户的监控,整个形成一套体系和闭环。
下面是我们基座,是我们底层数据生产引擎和底层仿真能力,构建了整个NIO自动化测试体系和实车的测试体系,保证全域领航的顺利发布、大里程的覆盖。
今天就介绍到这里,谢谢大家!
(注:本文根据现场速记整理,未经演讲嘉宾审阅)
文章来源于互联网:蔚来汽车杨进:智能驾驶测试评价技术方面的研究成果