當前位置: 華文世界 > 科技

麻省理工學院開發出更復雜的神經網絡控制器

2024-07-25科技

神經網絡對工程師設計機器人控制器的方式產生了巨大影響,催生了更具適應力和效率的機器。盡管如此,這些類似大腦的機器學習系統是一把雙刃劍:它們的復雜性讓它們變得強大,但也讓我們很難保證由神經網絡驅動的機器人能夠安全地完成任務。

驗證安全性和穩定性的傳統方法是透過稱為李亞普諾夫函數的技術。如果你能找到一個Lyapunov函數,它的值持續下降,那麽你就可以知道,與更高的值相關的不安全或不穩定的情況永遠不會發生。然而,對於由神經網絡控制的機器人,先前驗證李雅普諾夫條件的方法並不能很好地擴充套件到復雜的機器上。

麻省理工學院電腦科學與人工智能實驗室(CSAIL)和其他地方的研究人員現在已經開發出了新技術,可以在更復雜的系統中嚴格證明李雅普諾夫計算。該演算法有效地搜尋並驗證了Lyapunov函數,為系統的穩定性提供了保證。這種方法可能會使機器人和自動駕駛車輛(包括飛機和航天器)的部署更加安全。

為了超越以前的演算法,研究人員發現了一個簡單的訓練和驗證過程的捷徑。他們生成了更便宜的反例——例如,來自傳感器的對抗數據可能會脫離控制器——然後最佳化機器人系統來解決這些問題。了解這些邊緣情況有助於機器學習如何處理具有挑戰性的環境,從而使它們能夠在比以前更廣泛的條件下安全執行。然後,他們開發了一種新的驗證公式,可以使用可延伸的神經網絡驗證器α,β-CROWN,提供嚴格的最壞情況保證,而不是反例。

「我們已經在人工智能控制的機器上看到了一些令人印象深刻的經驗表現,比如人形和機器狗,但這些人工智能控制器缺乏對安全關鍵系統至關重要的正式保證,」麻省理工學院電氣工程和電腦科學(EECS)博士生、CSAIL附屬機構的楊陸傑說,他是與豐田研究所研究員戴宏凱(音譯)合著的一篇關於該專案的新論文的主要作者。Yang指出:「我們的工作彌合了神經網絡控制器的效能水平與在現實世界中部署更復雜的神經網絡控制器所需的安全保證之間的差距。」

為了進行數碼演示,該團隊模擬了帶有激光雷達傳感器的四旋翼無人機如何在二維環境中保持穩定。他們的演算法僅利用激光雷達傳感器提供的有限環境資訊,就成功地將無人機引導到穩定的懸停位置。在另外兩個實驗中,他們的方法使兩個模擬機器人系統在更廣泛的條件下穩定執行:一個倒立擺和一個路徑跟蹤車輛。這些實驗雖然規模不大,但相對而言比神經網絡驗證社區之前所能做的要復雜得多,尤其是因為它們包含了傳感器模型。

「與常見的機器學習問題不同,神經網絡作為Lyapunov函數的嚴格使用需要解決困難的全域最佳化問題,因此可延伸性是關鍵的瓶頸,」加州大學聖地亞哥分校(University of California at San Diego)電腦科學與工程副教授高思純(Sicun Gao)說,他沒有參與這項工作。「目前的工作透過開發演算法方法做出了重要貢獻,這些演算法方法可以更好地針對神經網絡作為控制問題中的李雅普諾夫函數的特殊使用進行客製。與現有方法相比,它在可伸縮性和解決方案質素方面取得了令人印象深刻的改進。這項工作為進一步開發神經Lyapunov方法的最佳化演算法以及在控制和機器人技術中嚴格使用深度學習開辟了令人興奮的方向。」

楊和她的同事們的穩定性方法在保證安全至關重要的領域具有廣泛的套用潛力。它可以幫助確保飛機和航天器等自動駕駛汽車的行駛更加平穩。同樣,運送物品或繪制不同地形的無人機也可以從這種安全保證中受益。

這裏開發的技術是非常通用的,而不僅僅是機器人技術;同樣的技術將來可能有助於其他套用,如生物醫學和工業加工。

雖然這項技術在可延伸性方面是對先前工作的升級,但研究人員正在探索如何在更高維度的系統中表現更好。他們還想解釋激光雷達讀數以外的數據,比如影像和點雲。

作為未來的研究方向,該團隊希望為處於不確定環境和受幹擾的系統提供相同的穩定性保證。例如,如果一架無人機面臨強風,楊和她的同事們希望確保它仍然能穩定地飛行並完成預期的任務。

此外,他們打算將他們的方法套用於最佳化問題,其目標是最小化機器人在保持穩定的情況下完成任務所需的時間和距離。他們計劃將他們的技術擴充套件到人形和其他現實世界的機器上,在這些機器上,機器人在與周圍環境接觸時需要保持穩定。