编者按:作者为Tarek El Dokor,汽车司机监控系统的视觉公司EDGE3 Technologies 的 CEO ,此前他是安博瑞德航空大学机器视觉实验室的教授和负责人。他在此文中阐述了监控司机的重要性,认为比起目前已经日益完善的自动驾驶系统,对司机的视觉监控同样是自动驾驶中不可或缺的一环。
Elon Musk 在特斯拉官方网站上宣布他的蓝图时表示,他依然支持颇具争议的 Autopilot 辅助驾驶模式。他认为,减少或取消特斯拉部分智能功能应该受到道德上的谴责。因为总得来说,这些智能功能仍在挽救生命。
毫无疑问,Autopilot 模式和其他类似的辅助驾驶功能增强了汽车的安全性。但是我作为EDGE3 Technologies公司的 CEO(一家开发汽车司机监控系统的视觉公司)和安博瑞德航空大学机器视觉实验室的前教授和带头人,我还有其他建议。换句话说,为了追求全面智能驾驶技术,盯着我们能够达到目的的必要技术,我们可能会忽略合适的技术开发路线。
尽管特斯拉的 Autopilot 模式非常具有开创性,但实际上它只是一个辅助驾驶功能,不是我们追求的全自动驾驶模式。在技术层面上讲,它是NHTSA-Level 2 自动驾驶系统,即至少有两个基本的自动化控制功能。这样的系统要求你的手一直放在方向盘上。
目前自动驾驶的真实状态和司机所预期的状态是有明显区别的。特斯拉最近发布的“双手必须放在方向盘上”的要求和标识并不意味着视线不能离开马路。即使双手还握着方向盘,实际上许多特斯拉或者其他汽车的车主可能会眼睛飘忽或者精神放空。他们希望 Autopilot 模式能达到自动驾驶(Level 3)或者全自动驾驶 (Level 4),然而在现实中,它只达到了 Level 2 级别。
如果车主不知道自己的汽车配有自动驾驶系统的级别,也情有可原,因为自动驾驶汽车可以自己在高速上跑几百英里,司机很容易进入到一种错误的安全感中,认为汽车是全自动驾驶的。这就导致了一些问题,比如今年年初开始已经有一些轻微的交通事故和至少一起撞击致死事故发生,都是由于驾驶者没有好好看路。Joshua Brown 的特斯拉正在高速公路上以 Autopilot 模式行驶,而他不知道自己已经身处险境,有报道称,这无疑是一个可以避免的悲剧,因为Brown 当时正在 DVD 上看电影。
NHTSA 指出,Level 3 级别汽车应该能了解周围环境,明白将要发生的状况,并且知道何时以及如何让司机自己控制汽车。自动驾驶汽车能够看到并理解周围环境,但是这一级别的自动驾驶仍然缺乏一个重要功能,就是何时以及如何将操控权交给司机。
现在缺失的技术是,不仅要确保驾驶员座舱内要有司机,还要让汽车了解司机的认知状态,清楚他或她对控制汽车的能力。实现这个功能的唯一办法就是在驾驶舱内安装一个面向驾驶员的摄像头。
检测司机的认知状态是很微妙且具有挑战的。不仅要显示在某一时间点司机在看什么,还要识别、检测司机的意识状态和认知。目前的系统是由许多自动化设备制造商开发的,例如一级供应商和二级供应商,包括 EDGE3,这些系统采用大量软件技术,但是都表现出一个共性,就是驾驶座内一个或多个摄像头能监控司机及其所看到的物体。
图像会被车载嵌入式处理器处理,获取传送的重要信息。可以监控司机且属于 Level 3 的自动驾驶技术尚未问世,产品方面存在许多技术竞争,包括立体摄像头和TOF摄像头(利用光的飞行时间测量距离)。哈曼和德尔福今年年初在 CES 表示,领先市场的大部分解决方案似乎都在关注视觉追踪。
尽管监控眼睛有效,但是将其放大监控整个面部、头部、面部表情和分层的远程信息处理能更精准地检测到司机的意识和认知:将驾驶舱内摄像头记录的图像、汽车远程信息处理和高级驾驶员辅助系统(ADAS)获得的信息结合起来确定司机的状态。
未来的 Level 3 级别自动驾驶汽车会捕捉到司机的驾驶行为、模式。有了这一功能,汽车就可以识别司机的反常行为,认为是司机处在危险状况或者精力不集中。监控司机不仅仅是简单的视觉系统,更是一种高级多传感器学习系统。
监控司机是一项重要的任务,是现在工业界高度重视的一个领域。例如,谷歌在自动驾驶方面已经决定在决策环中把司机完全“置之事外”,本质上已经超越 Level 3 ,并且认为这样更加安全。抛开社会影响,取消方向盘,直接跳过 Level 3 会让我们长期停留在 Level 2,因为随着我们的学习,无差错的自动驾驶会成为新的焦点。有专家在华尔街日报上说,要达到这个目标至少需要 15 到 20 年。
最复杂的自动驾驶技术也已经在复杂的环境下实现了。据谷歌的备案文件显示,加州交管局表示他们已经失败了数百次,需要重复进行人为干预。事实上在另一资料中显示,人类驾驶员已经数千次控制汽车并且行驶了 400 公里。自动驾驶汽车会提高性能,更了解周围环境,但是即便未来会有更高级的系统,汽车还是会处于复杂的日常环境。
这是技术的本质,汽车的高级驾驶员辅助系统不能躲开路上的障碍物,或者不能认出,还是需要司机自己控制。全自动化驾驶会引起其他道德问题,比如,在事故中应该责备谁?面对救驾驶员还是救其他人的时候,自动汽车会做什么决定?这些决定不只是在技术层面内,而是要将道德理解以及技术所处的社会水平考虑在内,还包括政策制定者、伦理学家和对其他人的影响。
前不久Uber发布了和谷歌类似的技术,尽管Uber方面称他们确定是专业的司机驾驶,能熟练地在复杂状况下控制汽车。很明显, Uber知道自己的技术不是全自动驾驶,需要司机来减小风险。但是如果司机头昏脑涨(报道中这种情况时有发生)或者控制得太晚会发生什么?很遗憾,Uber的团队没能监控司机何时以及如何控制汽车,这在设计上是一种硬伤。
在所有情况中,最关键的就是司机需要具有驾驶技术,能够在任何时间处理紧急情况,如果司机不能控制汽车,就需要有在数秒内解决问题的应急措施。
在 Level 3 中,深入理解司机的注意力是很重要的一步,如果汽车能更智能地了解相关风险程度,就会知道何时以及如何控制司机。我认为,Level 3 会让我们变得前所未有的真实,全自动 Level 4 驾驶更是如此。这样一来,我们就需要提高 Level 3 驾驶技术,让其上路成为现实。