本篇文章4335字,读完约11分钟
4月22日,阿里达摩研究所发布了世界上第一个用于自动驾驶的“混合模拟测试平台”。采用虚拟与现实相结合的仿真技术,引入真实道路测试场景和云训练器,可以提供最接近实际路况的仿真测试。模拟一个极端场景只需30秒,系统的虚拟测试里程每天可超过800万公里,这将大大提高自主驾驶ai模型的训练效率,加速自主驾驶的l5阶段。
也许很多人看到它会感到茫然,但作者对此非常兴奋。别担心,听我慢慢分析达摩研究所发布的“模拟路试平台”是什么意思。
要理解这个平台的意义,首先必须了解自动驾驶的实现。
简单地说,它可以分为:感知道路环境,处理数据和给出结果,以及控制车辆,其中最简单的方面是控制车辆。因为现在大多数车辆的方向、油门和刹车都是电子控制的,所以执行明确的命令并不难,但真正的困难在于感知道路环境并根据这些信息做出正确的决策。
专业术语有:感知、整合、决策和控制。也就是说,道路信息由传感器记录,信息被整合和分类并被发送到计算单元,数据被处理以做出选择,并且车辆驾驶根据给定的决定被控制。
困难在于感知、整合和决策。
尽管在过去的两年中,媒体频繁报道自动驾驶,但几乎所有人都在争论“激光雷达”、“5g技术”和“v2x(车辆到一切)”的问题。似乎大多数人都认为只要解决了“激光雷达成本”、“5g技术普及”、“v2x着陆”等问题,完全自主驾驶就很容易解决。
错了,这个想法和“我能用这个屏幕、键盘和鼠标得分”和“我能用这个厨具做好菜”的逻辑几乎是一样的。
激光雷达是一种传感器。问题在于它的成本和体积。高成本使其无法大规模应用于民用车辆。巨大的体积使车辆失去吸引力,并影响空气动力学。尽管近年来激光雷达的成本已经大大降低,并且在保证其性能的同时其体积越来越小,但是传感器硬件并不是决定自主驾驶发展的充分条件。
(激光雷达传感器效应)
5g技术可归类为v2x。5g技术从根本上解决了通信速度和延迟的问题。v2x只有在5g技术的支持下才能实现。这两者向自动驾驶的推进在于大量的车载和非车载传感器之间的通信,提供几乎所有的环境信息,也就是说,环境感知的来源不再局限于单个车辆,而是所有的网络化传感器都是汽车的“眼睛”;另一个功能是由于通信速度得到保证,信息处理单元不再局限于单个车辆的计算能力,可以将传感数据传输给云处理器,然后将决策传输给车辆执行,从而解决车载处理器计算能力不足的问题。
细心的你应该注意到5g和v2x都只能从本质上解决感知问题,而且由于目前车载计算能力已经足够(mobileye、Nvidia、Tesla等公司的车载自动驾驶芯片已经有足够的计算能力来满足自动驾驶的需求),事实上,云计算的好处并不高,所以这些仍然不是自动驾驶的核心痛点。
请注意,作者并没有说感知水平和计算能力水平不重要,因为没有足够的信息输入,就不足以做出正确的判断,而没有足够的计算能力,就不足以在很短的时间内做出决定。
然而,信息越多越好。虽然信息量越多,不确定性就越小,但是一旦信息量通过某个节点,其收入增长率就会逐渐下降,导致成本大幅增加;同样,计算能力的过剩也不会带来更多的好处,除了成本的大幅增加(此外,计算能力还受到功耗、体积等的限制)。
那么多少才够呢?
例如,上学时,有些人可以通过翻书和参加期末考试获得高分,而另一些人翻了无数本书,期末考试仍然不理想。每个人都有一双眼睛和一双耳朵,但最终他们的成绩是不同的,这本质上是由不同的智力或学习方法(思维和习惯)造成的。也就是说,如果你足够聪明,你可以在没有太多信息输入的情况下获得好的结果,也就是说,对于人来说,所谓的足够主要取决于智力的程度。
注意:智能不等于计算能力,因为计算能力是一个数据处理量的绝对值,类似于cpu的主频;智能可以简单地理解为计算能力*学习方法(思维、习惯),也就是说,人们常说天才不仅是高智能(高计算能力),而且是一种后天获得的思维方式。
行业内实现自动驾驶基本上有两种方式:“强感知、强智能”和“弱感知、强智能”。后一种方式目前只有少数企业采用,即以特斯拉为代表的基于视觉解决方案的战略;前者为大多数企业所采用,并具有额外的传感手段,如激光雷达和高精度地图,以增强“强感知”。
所谓的智能是指智能水平,而不考虑硬件的计算能力(tier1级处理器在自动驾驶方面的计算能力差别不大,除特斯拉之外,它们都从第三方购买芯片)。事实上,不同制造商真正竞争的领域是学习方法(思维和习惯)的改进,换句话说,这是软件层面的问题。这就是为什么自主驾驶行业的发展越来越偏向软件R&D公司,比如华为和达摩研究所。
对于自动驾驶来说,需要处理的路况极其复杂,因为除了固定的道路信息之外,每个人和车辆都是高度不确定的,可能的情况接近“无限”。如果程序员定义了车辆在什么情况下执行某些操作,那么它是“有限的”还是“无限的”,根本没有获胜的机会。因此,在信息集成和处理阶段,该行业无一例外地使用人工智能来训练神经网络,并通过深度学习(一种机器学习)来提高“智能”。
深度学习是神经网络的一种训练方法。简单的理解,即通过电子解构模拟人脑的学习方式,并通过大量的“学习材料”(数据)对其进行训练,可以使其获得像人类一样认识和理解世界的能力。(关于神经网络的原理,请参考作者的另一篇文章:骑士离现实有多远?(
例如,为神经网络学习拍一堆照片起初并不准确,就像你的父母在你小时候教你知道各种事情一样。然而,随着与同类事物的接触越来越多,识别率将迅速增加,直到无限接近100%。
当训练达到一定水平时,就好像人类对周围的事物相当熟悉。这时,你不需要仔细观察某样东西,或者你需要各种各样的信息来交叉和比较以确定它是什么。你只需要看着它就能确切地知道物体是什么。神经网络在自主驾驶领域的训练可以达到同样的效果。一旦训练水平足够,感知水平所需的信息量就非常少。
(神经网络训练示意图)
例如,comma.ai只需安装一部普通手机作为传感和计算单元,并添加自己的自动驾驶算法openpilot,就可以在普通车辆上实现2.5级自动驾驶。
创始人乔治霍兹是一个软件天才和黑客。他在2007年破解了第一部iphone,在2009年破解了iphone 3gs,后来又破解了索尼ps3和psn。他曾在特斯拉ap团队工作,并在2015年成立了自己的人工智能公司逗号. ai,专注于自动驾驶。他利用神经网络和机器学习开发了openpilot系统,并利用手机作为传感传感器和计算单元实现了2.5级自动驾驶。用户只需购买几百美元的设备,就可以将几个指定的车型换成l2.5级自动驾驶汽车。
然而,自主驾驶不同于考试,它不足以获得高分。最终目标是无限接近满分。毕竟,汽车本质上是一台高速行驶的“危险机器”,一个小小的错误可能会以生命为代价。
因此,整个自主驾驶行业已经逐渐从硬件竞争转变为机器学习竞争。也就是说,谁能更好更快地训练自动驾驶ai,谁就拥有真正的优势和技术壁垒。达摩研究所发布的自动驾驶模拟道路测试平台就是为这一目的服务的。
车辆所需的训练数据来自两种类型:模拟器和实际道路。
一般来说,车辆在最初的训练阶段是在模拟器中训练的。优点是他们可以一天24小时学习,从而大大提高了基本的自动驾驶能力。然而,问题是,虽然模拟器可以针对不同的道路环境进行定制,但它仍然不如实际道路的复杂条件,即培训是在模拟器中完成的,就像应试教育毕业的学生一样,仍然与社会脱节。
(1亿欧元的照片)
如果使用实际的道路数据,效果会好得多,但是实际的道路数据需要大量的车辆在普通的开放道路上行驶,并且只有一辆车达到这个水平:特斯拉。
根据二月底举行的缩放机器学习会议,特斯拉人工智能与视觉主管安德烈·卡普西分享了最新数据。启用ap时总里程数为30亿英里,启用noa(自动驾驶导航)时里程数超过10亿英里,自动换道超过20万次,高级智能呼叫次数超过120万次。
道场,特斯拉自己的大规模计算机集群项目,可以过滤和整合这些数据,并基于真实的道路测试信息进行无监督的ap算法(神经网络)的训练和优化升级。然而,这种规模和规划水平是任何自动驾驶公司多年前都无法达到的,无论是售出车辆的规模还是软件团队的进度。例如,从事自动驾驶十多年的谷歌团队waymo到目前为止只有2000万英里的路试里程。
一些研究机构表示,自动驾驶汽车需要积累177亿公里的实际道路测试数据,以确保自动驾驶的安全性。这样,它就进入了一个无限循环,自动驾驶能力不够,产品强度不够有吸引力,所以市场上行驶的车辆较少,模拟器培训无法与实际的驾驶考试培训竞争。
因此,达摩研究所发布的自动驾驶模拟路试平台派上了用场。
该平台可以通过其他方式收集真实的道路信息,并将其集成到模拟器环境中,也就是说,神经网络系统可以比一般的模拟器得到更真实的训练,并且可以接近道路测试数据的水平。该平台甚至通过算法模拟人类的不确定性,随机干预车辆,模拟现实中各种奇怪的驾驶习惯和场景。由于其强大的性能,传统的极其复杂的场景只需要一个月的时间,而在达摩学院这个平台上,复杂场景的构建和测试准备只需要30秒钟就可以完成,每天支持的场景数量可以达到数百万。与普通模拟器相比,总体训练效率将提高一百万倍。
这对其他自动驾驶公司来说无疑是个好消息。
然而,值得注意的是,这个平台就像一个高级培训课程,它能得到多大的改进取决于它自己的算法。因为深度学习本身并不复杂,稍微了解蟒蛇的朋友可以自己玩。例如,chares 2.0系统是一个由外国博主为gta5游戏编写的自动驾驶软件。经过半年多的训练和优化,它已经能够在游戏中取得比较好的效果。
但是开始容易,掌握起来难。提高效率和优化算法是极其复杂的。这就是为什么近年来,不止一家公司被特斯拉起诉,前员工将一些算法代码“偷”到隔壁家使用。
(之前的自动驾驶公司zoox承认员工偷了特斯拉ap算法)
综上所述,虽然硬件技术很重要,但它只是门槛,真正的技术障碍和难点,它集中在自主驾驶神经网络的训练上。而且基于神经网络的训练模式,这种进步的速度超出了普通人的想象。最简单的例子是谷歌的阿尔法围棋在短短几年内击败了世界顶级围棋大师。
当然,要完全克服适用于所有场景的全自动驾驶(l5级),需要工程师们付出大量的长期努力。然而,自动驾驶的发展速度不能再被描述为不断变化,而应该每分钟测量一次。神经网络系统一直在通过大量数据进行“进化”,这相当于一个顶尖天才不用休息就能高效地学习,其结果是可以想象的。
很多人可能并不关心这次达摩研究所发布的模拟道路测试平台,但是请记住作者的话,在不久的将来,你使用的自动驾驶系统可能会在这里“毕业”。
来源:BBC新闻网
标题:去了达摩院,修得真自动驾驶?
地址:http://www.0bbc.com/xbglxw/15056.html