神经网络对工程师设计机器人控制器的方式产生了巨大影响,催生了更具适应性和效率的机器。尽管如此,这些类似大脑的机器学习系统是一把双刃剑:它们的复杂性让它们变得强大,但也让我们很难保证由神经网络驱动的机器人能够安全地完成任务。
验证安全性和稳定性的传统方法是通过称为李亚普诺夫函数的技术。如果你能找到一个Lyapunov函数,它的值持续下降,那么你就可以知道,与更高的值相关的不安全或不稳定的情况永远不会发生。然而,对于由神经网络控制的机器人,先前验证李雅普诺夫条件的方法并不能很好地扩展到复杂的机器上。
麻省理工学院计算机科学与人工智能实验室(CSAIL)和其他地方的研究人员现在已经开发出了新技术,可以在更复杂的系统中严格证明李雅普诺夫计算。该算法有效地搜索并验证了Lyapunov函数,为系统的稳定性提供了保证。这种方法可能会使机器人和自动驾驶车辆(包括飞机和航天器)的部署更加安全。
为了超越以前的算法,研究人员发现了一个简单的训练和验证过程的捷径。他们生成了更便宜的反例——例如,来自传感器的对抗数据可能会脱离控制器——然后优化机器人系统来解决这些问题。了解这些边缘情况有助于机器学习如何处理具有挑战性的环境,从而使它们能够在比以前更广泛的条件下安全运行。然后,他们开发了一种新的验证公式,可以使用可扩展的神经网络验证器α,β-CROWN,提供严格的最坏情况保证,而不是反例。
「我们已经在人工智能控制的机器上看到了一些令人印象深刻的经验表现,比如人形和机器狗,但这些人工智能控制器缺乏对安全关键系统至关重要的正式保证,」麻省理工学院电气工程和计算机科学(EECS)博士生、CSAIL附属机构的杨陆杰说,他是与丰田研究所研究员戴宏凯(音译)合著的一篇关于该项目的新论文的主要作者。Yang指出:「我们的工作弥合了神经网络控制器的性能水平与在现实世界中部署更复杂的神经网络控制器所需的安全保证之间的差距。」
为了进行数字演示,该团队模拟了带有激光雷达传感器的四旋翼无人机如何在二维环境中保持稳定。他们的算法仅利用激光雷达传感器提供的有限环境信息,就成功地将无人机引导到稳定的悬停位置。在另外两个实验中,他们的方法使两个模拟机器人系统在更广泛的条件下稳定运行:一个倒立摆和一个路径跟踪车辆。这些实验虽然规模不大,但相对而言比神经网络验证社区之前所能做的要复杂得多,尤其是因为它们包含了传感器模型。
「与常见的机器学习问题不同,神经网络作为Lyapunov函数的严格使用需要解决困难的全局优化问题,因此可扩展性是关键的瓶颈,」加州大学圣地亚哥分校(University of California at San Diego)计算机科学与工程副教授高思纯(Sicun Gao)说,他没有参与这项工作。「目前的工作通过开发算法方法做出了重要贡献,这些算法方法可以更好地针对神经网络作为控制问题中的李雅普诺夫函数的特殊使用进行定制。与现有方法相比,它在可伸缩性和解决方案质量方面取得了令人印象深刻的改进。这项工作为进一步开发神经Lyapunov方法的优化算法以及在控制和机器人技术中严格使用深度学习开辟了令人兴奋的方向。」
杨和她的同事们的稳定性方法在保证安全至关重要的领域具有广泛的应用潜力。它可以帮助确保飞机和航天器等自动驾驶汽车的行驶更加平稳。同样,运送物品或绘制不同地形的无人机也可以从这种安全保证中受益。
这里开发的技术是非常通用的,而不仅仅是机器人技术;同样的技术将来可能有助于其他应用,如生物医学和工业加工。
虽然这项技术在可扩展性方面是对先前工作的升级,但研究人员正在探索如何在更高维度的系统中表现更好。他们还想解释激光雷达读数以外的数据,比如图像和点云。
作为未来的研究方向,该团队希望为处于不确定环境和受干扰的系统提供相同的稳定性保证。例如,如果一架无人机面临强风,杨和她的同事们希望确保它仍然能稳定地飞行并完成预期的任务。
此外,他们打算将他们的方法应用于优化问题,其目标是最小化机器人在保持稳定的情况下完成任务所需的时间和距离。他们计划将他们的技术扩展到人形和其他现实世界的机器上,在这些机器上,机器人在与周围环境接触时需要保持稳定。