一个不需要再等红灯的未来?
编译 / 张 鸥
编辑 / 涂彦平
设计 / 赵昊然
滥觞 / MIT,作者:Adam Zewe/MIT News Office
没有人喜欢坐在红灯前。
车辆停下来期待 信号灯变更 ,当然是交通管束 的必备根本 方法,然则 难免 会使赶时间的人加倍 心急如焚。事实上,这些时间也是在持续 消耗不需要 的燃料并排放温室气体。
如果驾驶者可以掌握他们的出行时间,做到在绿灯时达到 十字路口呢?
在一项新的研究中,麻省理工学院的研究人员展示了一种机械 学习办法 ,该办法 可以学习掌握 自动驾驶车队,当它们接近并通过一个有信号灯的十字路口时,能够保持 交通顺畅。
通过模拟,他们觉察该办法 可以削减 燃料消耗和排放,同时提高平均车速。如果途径 上的所有汽车都具备自动驾驶功能 ,这项技巧 会获得 最好的实施成果 ,但即便只有25%的汽车使用他们的掌握 算法,仍然会带来伟大 的燃料和排放效益。
“十字路口是一个异常 有趣的、可以进行干预干与的处所 。”高等 作者凯茜·吴(Cathy Wu)说。她是土木与情况 工程系Gilbert W. Winslow职业成长 助理传授 ,也是数据、系统和社会研究所(IDSS)和信息与抉择计划 系统实验室(LIDS)的成员。
本次研究的主要作者是文杜拉·贾亚瓦达纳(Vindula Jayawardana),LIDS和电气工程与盘算 机科学系的研究生。研究将在2022年7月11-14日举办 的欧洲掌握 会议(ECC)上揭橥 。
错综庞杂 的十字路口
十字路口可能会涌现 数十亿种不合 的情况,这取决于车道的数量、信号灯的运作方法 、车辆的数量和速度、行人和骑车人的存在等等。
解决十字路口掌握 问题的范例办法 是使用数学模型来得出一个简单 、幻想 的交叉口。这在纸面上看起来不错,但在现实世界中很可能站不住脚,因为真实的交通状况往往是凌乱 的。
文杜拉和凯茜换了个角度,使用一种被称为深度强化学习的无模型技巧 来解决这个问题。
强化学习是一种试错办法 ,掌握 算法学习做出一系列抉择计划 。当它找到一个好的序列时,会获得 嘉奖 。
“这对于解决像这样的长线问题很有用。掌握 算法必须 在一个较长的时间段内向车辆发出500条以上的加快 指令。”凯茜说明 说。
但还有一个额外的问题。研究人员希望该系统能够学习一种策略,削减 燃料消耗,并限制对旅行时间的影响。这些目标可能相互矛盾。
“为了削减 旅行时间,我们希望汽车开得快;但为了削减 排放,我们希望汽车慢下来或根本 不动。这些相互竞争的嘉奖 可能会使算法涌现 异常 利诱的情况。”凯茜说。
研究人员采取 了一种被称为嘉奖 塑造的技巧 来进行变通。通过嘉奖 塑造,他们给系统一些它自己无法学习的领域知识。在这种情况下,每当车辆完全停止时,他们 就 对系统进行处罚,这样它就会逐步开端 避免这种行为。
交通测试
一旦研究人员开拓出一种有效的掌握 算法,他们就使用一个具有单一交叉口的交通模拟平台对其进行评估。
该掌握 算法被应用于一个由联网的自动驾驶车辆组成的车队,这些车辆可以与即将到来的交通信号灯进行通信,以吸收 信号灯的变更 和时间信息,并不雅 察周围情况 。这个算法告诉 每辆车如何加快 和减速。
在模拟中,系统并没有在车辆接近十字路口时造成时走时停的路况。(时走时停的路况是指由于前面的车辆被信号灯中止,后续车辆被迫完全停止行驶。)
如果路上的每辆车都是自动驾驶的,他们的掌握 系统可以将油耗降落18%,二氧化碳排放量降落25%,同时将行驶速度提高20%。
“一次干预干与能够涌现 20%-25%的燃料或排放削减 ,真的令人难以置信。但我认为 有趣的是,也是我真正希望看到的,是这种非线性的比例。”凯茜说,“这意味着我们不必比及 实现100%的自动驾驶车队之后能力 从这种办法 中获益。”
接下来,研究人员希望研究多个交叉口之间的互动效应。他们还筹划 探索不合 的交叉口设置(车道数量、信号灯、计时等)如何影响行驶时间、排放和燃料消耗。
此外,他们还将研究 当 自动驾驶汽车和人类司机共享途径 时,他们的掌握 系统会如何影响平安性。例如,即使自动驾驶车辆的驾驶方法 可能与人类司机不合 ,但速度较慢的途径 和速度较稳定的途径 可以提高平安性。
虽然这项工作仍处于早期阶段,但凯茜认为这种办法 在不远的未来可以实施。