【智驾深谈】Mobileye,用单目视觉点亮自动驾驶

    xiaoxiao2022-05-04  238

    早期做自动驾驶的小伙伴几乎每个人都自己动手写过车道线识别程序,OpenCV写写,霍夫变换写写,模板匹配写写,再复杂一点弄个RANSAC,或者滤波投票。然而一遇到光线变化就挂了,遇到天气变化也会挂,车速高了也挂,总之各种挂。体验了各种挫败感之后,大部分人都转而投向激光和差分的方案,丢下一句“现在视觉还尚未成熟”之类的话。

    我之前也一直这么认为,视觉太难做,直到我有一天看到了Mobileye的结果,漂亮得一塌糊涂,比如上图里这种,从没有车道线的地方都能推理出车道线(传说中的HPP,Holistic Path Planning),只能说彻底给跪了。

    几周前创新港做过一期专门的微讲座,请了Mobileye中国区总经理苏淑萍女士介绍工作,期间她分享了这样一些数字,截至2015年底,全球超过1000万装机量,覆盖超过20家车企的273款车型。集成度极高的解决方案,快速的市场推进速度,无一不让所有人觉得眼前一亮,而这些成功的背后,则是其多年积累的强大算法支撑。

    两位老伙计

    1999年,早在Google自动驾驶火起来的十年之前,以色列Hebrew大学教授Amnon Shashua(现任CTO)和连续创业成功者Ziv Aviram(现任CEO)就看到了视觉技术用于汽车安全的可能性,联合创办了Mobileye,致力于用单目视觉提供包括行人检测、车道保持和自适应巡航等辅助驾驶技术。

    2014年8月IPO,Mobileye被称为以色列有史以来最成功的IPO,首日涨幅接近50%。时至今日谈起这家公司,相信大家都不陌生了,毕竟市值过百亿的算法公司不多,而连续十几年看准一件事情坚持做下来的实属凤毛麟角。

    成功总是青睐有准备的人,从商业上来讲,Aviram丰富的经验赢得了强有力的资金支持,一开始不考虑机构的钱,固执的认为机构都是急于变现的人,他的模式让我想起网易的丁磊。因此,从开始直到2007年,Mobileye的资金支持大部分来自朋友和天使投资人,这群人充分的信任给了Mobileye充分的发展空间,使其早期基于视觉的方案在业界不看好的情况下顽强生存了下来,并证明了自己的价值所在(当年BMW,GM和Volvo成为首批配装Mobileye的车企)。在此之后,Aviram开始引进机构投资,此时的机构已经认识到了Mobileye的潜力,支持力度很大,使得哪怕在2008-2010年经济衰退期,Mobileye的账面上都余粮很多,从技术上可以比较激进发展。

    从技术上来讲,早在2000年左右,比较了毫米波、激光雷达和摄像头传感器之后,考虑到可靠性、易用性和性价比,Shashua就坚定地走上了单目视觉这条路。一直以来,Shashua致力将Mobileye打造成当今ADAS的核心部件。远在大多数车企意识到ADAS重要性之前,他们已经设计出一套完整的、可提供多种安全功能的集成视觉系统,以至于后来2010年率先推出行人碰撞预警系统,2013年推出自动紧急刹车系统,2013年推出纯视觉ACC系统等,都充分体现了Shashua对此有非常超前的认识。

    在一次接受哈佛商学院的采访中,Shashua还提到Mobileye发展过程中最重要的两个战略决定:一是将各类安全功能全部集成到一款产品中,而不是拆分销售,很大程度上提高了产品的竞争力和可维护性;二是决定自主研发片上系统(SoC),这为后来量产化时降低成本、掌握更多设计自主权打下了基础。

    自动驾驶线路图

    在辅助安全产品上的成功,让两位创始人开始展望未来,而辅助功能的进一步升级就是自动驾驶。随着城市交通拥堵的日益严重,以及不靠谱司机的日益增多,NHSTA开始着手推动自动驾驶功能上车,具体的是在其评分标准中,达到4-5星评级的产品,应具备一定程度的自动驾驶能力,例如ACC和AEB。

    对此,在过去的一年中,Mobileye比较侧重地向自动驾驶方向做了一些调整,在2016年的CES上,Shashua给了一个很偏技术的keynote演讲,阐述了在自动驾驶方面的路线图:以当前的感知产品为基础,为自动驾驶系统提供可行区域和障碍物信息;通过已经配装在车上的Mobileye进行地图的收集,以及开发驾驶决策控制算法。

    长久以来,自动驾驶技术被划分为两个阵营,一个是源自Darpa,由一群机器人学家构成的“特定区域全自动驾驶派”,以Google为首,试图通过大数据和人工智能技术来革新驾驶体验。另一个则是源自车企,由一群汽车电子工程师构成的“全区域部分自动驾驶派”,试图将该技术以新功能的形式添加到汽车进而盈利。Mobileye偏向后者,希望能够以一种递进的方式,逐步推进自动驾驶技术,而Shashua的计算机科学背景让他们同时兼顾了人工智能技术,并将其大量运用于产品当中。

    总体来讲,Mobileye在自动驾驶的布局分为三个部分,也可以认为是三个阶段:感知、高精地图和驾驶决策。

    当前比较成熟的,是它的感知技术,已经大量运用在已有产品中,主要提供一个环境模型(Environmental Model),包括运动和静止的物体、车道线、可行驶区域和交通标志等。

    多年的积累,让Mobileye在环境模型方面能够提供的内容远超竞争对手,在别人还在尝试提高单一车道线的检测精度时,Mobileye已经可以提供道路的语义级特征描述,例如当前行驶车道的左右车道线、左右车道的左右线以及道路分叉等等,均通过深度神经网络识别。

    谈到深度学习,就需要提一下现在很火的End-to-End方法。智驾深谈第一期的时候,我们曾经介绍了独行侠GeoHot和他的Comma.ai,Shashua对于端到端方法也有自己的看法,简单来说是不看好的。他认为端到端不考虑专家经验,不考虑领域知识,不考虑人工监督,对极端情况(Corner Cases)的应变能力比较差。相比来讲,Mobileye将感知任务划分成多个模块,每个对应一个人工监督的神经网络,所得出的效果已经可以产品化。

    第二个方面,是高精度地图技术(称作REM,Road Experience Management),该技术是自动驾驶不可或缺的支撑,区别是是否使用复杂的3D激光雷达来采集和制作地图,Shashua认为并不需要,而是通过图像中丰富的纹理和色彩特征来生成地图。Mobileye采取的策略是三维上稀疏,地面一维稠密的结构,三维元素不会包括原始图像数据,而是经过识别后的语义信息。

    地面一维的信息则包括的比较多,建立了一个道路模型,包括车道线的精确位置、连接关系等。

    值得一提的是,当前高精度地图供应商,在生产和维护地图方面成本很高,而Mobileye则采取群体智能的方式来解决这个问题,通过大量装配在量产车上的Mobileye现有产品来分布式收集和更新数据。

    第三个方面,也是自动驾驶技术公认的难点,即决策与规划技术。目前Mobileye也在利用深度学习进行初步的尝试,跟DeepMind采用的DQN网络不同,他们还考虑了驾驶过程中的时序性。

    结语

    总体上来看,Mobileye依托单目视觉技术,正在逐步铺平通向全自动驾驶的道路,在此过程中不断收集驾驶数据,优化驾驶模型,更新驾驶产品。今天的Mobileye ADAS系统,在未来会逐渐完成高速自动、环路自动和城区自动等功能,最终达到A点到B点的全自动驾驶,让我们拭目以待。

    (本文图片来自Shashua教授近年公开演讲

    文章转载自新智元公众号 原文链接


    最新回复(0)