您的位置：首页 >创业 >

「谷歌无人车之父」点评滴滴5小时无接管路测视频：最难挑战的场景是哪个？

时间：2021-04-17 13:46:53 | 来源：机器之心Pro

来源：机器之心

作者：曹锦

5小时+无人接管+复杂场景。Robotaxi距离商业化还有多远？

4月8日，滴滴自动驾驶发布了一支自动驾驶长达5小时、未经剪辑的无接管自动驾驶视频。在该视频以多倍速播放的过程中，滴滴自动驾驶公司COO孟醒，邀请Udacity创始人兼董事长，谷歌无人驾驶项目创始人——Sebastian Thrun连线讨论视频中的技术亮点。

可以看出，滴滴如今的自动驾驶路测表现与去年相比已经有了大幅优化，能够应对多个复杂场景。一位自动驾驶企业从业人员对Auto Byte表示：「在评价路测时，首先要看复杂场景的应对，其次要看感知决策画面的准确性。据此来看滴滴发布的视频，的确能直观感受到其自动驾驶技术的进步。」不过，也有出行领域从业人士称，「滴滴的这次路测属于主流自动驾驶企业的平均水准，这次视频的亮点在于时长以及Thrun的点评，让大家意识到目前我们能应对的场景，以及与商业化之间的距离。」

本次视频是在滴滴自动驾驶团队软件版本迭代后，于近期录制的。测试用车是沃尔沃的XC60，上面有3颗激光雷达，7个摄像头。对于RoboTaxi企业来说，越是复杂的场景就越需要攻克，因为这些场景往往是在打车下单的高发路段。所以，滴滴此次发布的视频中，测试车辆行驶于上海嘉定区，途经范围包括人流密集的嘉亭荟商业区，工厂区，办公区和住宅区等，并且经历了白天、黄昏和夜晚，并经历了通勤晚高峰，与大量行人及单车并行。

「多数研发人员不会在具有挑战性的场景下测试并将视频公开，这说明了滴滴自动驾驶的自信和可靠。」Sebastian Thrun给予肯定评价。5小时的测试过程中，滴滴路测车辆在环境感知、行为决策、运动规划与控制等各方面表现平稳。

的确，路测视频大家都在发布，似乎并没有多新鲜。不过，「5小时持续无接管」这样的亮点，再加上Thrun的相关点评，都能够体现出RoboTaxi乃至当前自动驾驶科技整体发展水准以及仍将持续面对的复杂场景难点。

场景一：持续逆光照射

在日落时分的强光环境下，太阳直射进摄像头，挡住了几乎40%的屏幕。人类驾驶员通常需要戴上眼镜或打开遮阳板，而滴滴自动驾驶则通过多传感器融合方案以及添加和光照相关的数据增强，确保不同亮度下的感知效果，从而达到即便在严重逆光的情况下依旧能够准确识别和避让行人、汽车和其它物体的目的。

多传感器的方案能够聚合各个传感器的优势。比如在强光条件下激光雷达就可以发挥更重要的作用。同时系统也会连续监测周围环境的亮度，当亮度过低达到预设阈值时，系统会自动切换成模式进行更好的识别。比如日落之后，车辆就会开启夜间模式，通过数据增强来帮助摄像头对红绿灯等拥有更准确的识别效果。

场景二：警察穿梭检查

在本次路测视频中，警察穿梭检查的场景引发了Thrun对于「车辆理解人类」的探讨。路测中的车辆判断出有警察在路中间穿梭检查，存在高风险，致使及时靠边让行。

对于是否需要识别行人特殊身份及手势等意图，Thrun表示，所有自动驾驶公司都面临让汽车理解人类的典型行为交互的挑战，这不光意味着在此种场景下，车辆需要准确识别出警察及其手势而停车，还需要在警察短暂离开的情况下持续等待不可驶离，并能了解何时能够通行。「如果你了解加州交规，你会发现理解交警意图是一个重要组成。在将人类驾驶员完全解放之前，我们必须确保汽车能够理解警察意图，这是最大的挑战。」

对此，孟醒表示，滴滴用海量数据来理解世界，会有助于处理这些罕见但很重要的场景。而除了让系统来理解这种场景，或许还可借助远程协助、操控等方式。

场景三：学校路段

当路测到了放学时间，在一处幼儿园和学校路段上，家长的大量车辆停在路边，而滴滴测试车较为顺畅地通过。孟醒表示，在保证安全的基础上，滴滴自动驾驶对于学校路段提出了更高的安全标准。在最新版本的软件中，特别是在预测模型中，对一些高安全标准场景创建了特殊的案例，通过识别路段感知或在地图上检测到这些场景时，能够切换到一个额外的预测层，即安全模式。同时，滴滴也将使用更多的数据来做处理街上的无规律和反常情况。

对此，Thrun表示，尽管视频是8倍速播放的，但能在幼儿园这种场景下这样快速通行也是令人惊讶的。现实中的人们不敢在围绕孩子的街区开这么快的车，这就说明测试车辆对于周边环境的感知和识别相当自信。

场景四：大型车

在学校路段中，测试车的右侧有一辆原本静止不动的公交车，突然并入测试车道，而测试车必须避让等待。孟醒表示，大型车是自动驾驶最困难的场景之一，滴滴处理的方案是，除了在典型边界框顶部跟踪，也使用了原始点云进行分割，以确保对大型车轮廓识别的大小正确。

Thrun则点评道，在此场景下，激光雷达显示的数据对日光干扰的鲁棒性要强得多。针对大型车并线的状况，显然不能再使用摄像头进行分类。如果没有激光雷达，甚至很难看见公交车。同时，这种情况也需要足够优秀的软件来应对。

场景五：十字路口及无保护转向

在一个向左的无保护转向中，可以看到有多个行人及自行车通行，测试车等待所有人通行后，继续完成转向。「我们用了4-5个月来处理转弯场景，因为这里有大量社会性交互。」孟醒说，这种路口及转向涉及到很多微妙的社会规则和博弈论。

Thrun点评称，「你的无人驾驶车的行为比大多数司机都要更小心一些，安全比赶时间更加的重要，我认为这是正确权衡过的结果。」不过，他也指出，在路口的等待，牵扯到「明文法律」之外的、不成文的社会行为法则。例如Waymo 的「3秒法则」——十字路口的四个方向都有STOP标牌，通常人类驾驶员会有默认的排序规则，但自动驾驶车严格排队，等待3秒确认安全。但有时明明车辆有路权通行，自动驾驶车还会等待一个又一个「3秒」，导致总被人抢先。「我们应该做到不仅仅是额外的3秒，而是明白如何与他人沟通，在十字路口设法以某种方式告诉大家，轮到我走了……这种可靠水平与之前的3秒安全时间完全不一样。」

滴滴自动驾驶COO孟醒（右下）与Udacity创始人兼董事长Sebastian Thrun讨论落日场景

自落地以来，滴滴自动驾驶在技术维度专注数据驱动的方式解决城市道路上的复杂场景。虽然2019年8月刚升级为公司，且在2020 DMV自动驾驶路测报告上与AutoX等排名靠前的企业差距尚大，但滴滴自动驾驶也仍排在Top10。去年6月，滴滴在上海面向公众推出载人测试服务。

依托网约车和路测收集和使用大量的本地化数据推动算法迭代。比如对于路口交互这种城市道路的典型场景，滴滴使用了机器学习算法，基于对大量该区域的人工驾驶车辆数据进行分析和利用以提升对交通参与者行为的预测准确性，从而改善自动驾驶车在路口避让等交互场景的处理能力。

在进行总结时，Thrun对自动驾驶的发展现状进行了客观的预判，也就是：不能指望快速实现人类驾驶员直接过渡到完全自动驾驶，在未来的10-20年，都会是混合交通情况。「如果能做到完全无人驾驶，就可以摆脱交通灯了，因为自动驾驶汽车不依赖交通灯或其他指示通过交叉路口。」在他看来，自动驾驶汽车永远不应排在第一位，人类才是。人们制定规则是为了让人更加的有效率，而不是让机器更有效率。在滴滴发布的这段视频中，我们能看到目前无人驾驶车可以达到的大致水平，也能看到将其打造得更加理想化所面临的技术难点。将这些复杂场景以及自动驾驶的处理表现展示给公众，这就是滴滴此次发布视频最大的意义。

建新·见智 —— 2021亚马逊云科技 AI 在线大会

4月22日 14:00 - 18:00

为什么有那么多的机器学习负载选择亚马逊云科技？大规模机器学习、企业数字化转型如何实现？

《建新 · 见智——2021 亚马逊云科技 AI 在线大会》由亚马逊云科技全球人工智能技术副总裁及杰出科学家 Alex Smola、亚马逊云科技大中华区产品部总经理顾凡领衔，40多位重磅嘉宾将在主题演讲及6大分会场上为你深度剖析亚马逊云科技创新文化，揭秘 AI/ML 如何帮助企业加速创新。

分会场一：亚马逊机器学习实践揭秘

分会场二：人工智能赋能企业数字化转型

分会场三：大规模机器学习实现之道

分会场四：AI 服务助力互联网快速创新

分会场五：开源开放与前沿趋

分会场六：合作共赢的智能生态

6大分会场，你对哪个主题更感兴趣？