當前位置: 華文世界 > 科技

控制變形軟體機器人的更好方法

2024-05-11科技

想象一下,一個類似粘液的機器人可以無縫地改變其形狀以擠過狹窄的空間,這些空間可以部署在人體內部以移除不需要的物品。

雖然這種 機器人 在實驗室之外還不存在,但研究人員正在努力開發可重新配置的軟機器人,用於醫療保健、可穿戴裝置和工業系統。

但是,如何控制一個沒有可以操縱的關節、四肢或手指的軟綿綿的機器人,而是可以隨意徹底改變其整個形狀呢? 麻省理工學院的研究人員正在努力回答這個問題。

該研究 發表在 arXiv 預印本伺服器上。

他們開發了一種 控制演算法 ,可以自主學習如何移動、拉伸和塑造可重構的機器人以完成 特定任務 ,即使該任務需要機器人多次改變其形態。 該團隊還構建了一個模擬器,用於測試可變形軟體機器人的控制演算法,以完成一系列具有挑戰性的變形任務。

他們的方法完成了他們評估的八項任務中的每一項,同時優於其他演算法。 該技術在多方面任務中特別有效。 例如,在一項測試中,機器人必須降低其高度,同時長出兩條小腿以擠過狹窄的管道,然後取消這些腿並伸展其軀幹以開啟管道的蓋子。

雖然可重構的軟體機器人仍處於起步階段,但這種技術有朝一日可以使通用機器人能夠調整其形狀以完成各種任務。

「當人們想到軟體機器人時,他們往往會想到那些有彈性但又恢復到原來形狀的機器人。 我們的機器人就像粘液一樣,實際上可以改變它的形態。 非常令人驚訝的是,我們的方法之所以如此有效,是因為我們正在處理一些非常新的東西,「電氣工程和電腦科學(EECS)研究生Boyuan Chen說,他是一篇關於這種方法的論文的合著者。

Chen的合著者包括主要作者黃蘇寧,他是中國清華大學的本科生,在麻省理工學院存取期間完成了這項工作; 清華大學助理教授徐華哲; 資深作者Vincent Sitzmann是麻省理工學院EECS的助理教授,領導電腦科學和人工智慧實驗室的場景表示小組。 該研究將在學習表征國際會議上發表。

控制軔態運動

科學家經常使用一種稱為強化學習的 機器學習方法 教機器人完成任務,這是一個試錯過程,在這個過程中,機器人會因使其更接近目標的行為而獲得獎勵。

當機器人的運動部件一致且定義明確時,這就會有效,就像一個有三個手指的抓手。 使用機器人抓手,強化學習演算法可能會稍微移動一根手指,透過反復試驗來學習該動作是否為它贏得了獎勵。 然後它會移動到下一個手指,依此類推。

但是,由磁場控制的變形機器人可以動態地擠壓、彎曲或拉長整個身體。

「這樣的機器人可能有數千塊小肌肉需要控制,所以很難用傳統方式學習,」陳說。

為了解決這個問題,他和他的合作者不得不以不同的方式思考。 他們的強化學習演算法不是單獨移動每塊微小的肌肉,而是從學習控制協同工作的相鄰肌肉組開始。

然後,在演算法透過關註肌肉群來探索可能的行動空間後,它會深入研究更精細的細節,以最佳化它所學習的策略或行動計劃。 這樣,控制演算法遵循從粗到細的方法。

「從粗到細意味著當你采取隨機行動時,該隨機行動可能會有所作為。 結果的變化可能非常顯著,因為你同時粗略地控制了幾塊肌肉,「Sitzmann說。

為了實作這一點,研究人員將機器人的動作空間,或者它在某個區域的移動方式,如影像一樣。

他們的機器學習模型使用機器人環境的影像來生成一個 2D 動作空間,其中包括機器人及其周圍區域。 他們使用所謂的材料-點-方法模擬機器人運動,其中動作空間被點(如影像像素)覆蓋,並覆蓋網格。

與影像中附近的像素相關(如照片中形成樹的像素)一樣,他們構建了自己的演算法來理解附近的動作點具有更強的相關性。 當機器人改變形狀時,機器人「肩膀」周圍的點會以類似的方式移動,而機器人「腿」上的點也會以類似的方式移動,但與「肩膀」上的點不同。

此外,研究人員使用相同的機器學習模型來觀察環境並預測機器人應該采取的行動,這使得它更有效率。

構建模擬器

在開發這種方法之後,研究人員需要一種方法來測試它,因此他們建立了一個名為DittoGym的模擬環境。

DittoGym 具有八項任務,用於評估可重構機器人動態改變形狀的能力。 在其中一種情況下,機器人必須拉長和彎曲其身體,以便它可以繞過障礙物到達目標點。 在另一種情況下,它必須改變其形狀以模仿字母表中的字母。

「我們在 DittoGym 中的任務選擇既遵循通用強化學習基準設計原則,也遵循可重構機器人的特定需求。 每個任務都旨在代表我們認為重要的某些內容,例如在遠距離探索中導航的能力、分析環境以及與外部物體互動的能力,「黃說。

「我們相信,它們可以讓使用者全面了解可重構機器人的靈活性以及我們 強化學習 方案的有效性。」

他們的演算法優於基線方法,是唯一適合完成需要多次形狀變化的多階段任務的技術。

「我們在彼此更接近的行動點之間有更強的相關性,我認為這是使這項工作如此成功的關鍵,」陳說。

雖然變形機器人在現實世界中部署可能還需要很多年,但Chen和他的合作者希望他們的工作不僅能激勵其他科學家研究可重構的軟機器人,而且還要考慮利用2D動作空間來解決其他復雜的控制問題。