機器之心報道
編輯:杜偉、大盤雞
可以想象,不斷前進演化的雙臂機器人未來將最大程度地「解放」人的雙手。2023 年,史丹佛大學等機構推出了一個用於雙機械手遠端操作的低成本開源硬體系統 ALOHA,它可以遠端操作並完成組裝鏈條、托舉桌球等復雜、豐富的任務。
今年 1 月,谷歌 DeepMind 與史丹佛又聯合推出了 Mobile ALOHA,同樣可以進行遠端操作並模仿雙手操作,透過移動底座在大的空間範圍內實作遠端操作。這樣一來,備菜、翻炒、出鍋,洗衣、逗貓、澆花它是樣樣精通,名副其實的家務機器人火出了圈。
今天,谷歌 DeepMind 聯合史丹佛推出了 ALOHA 的增強版本 ——ALOHA 2。與一代相比,ALOHA 2 具有更強的效能、人體工程學設計和穩健性,且成本還不到 20 萬元人民幣。
並且,為了加速大規模雙手操作的研究,ALOHA 2 相關的所有硬體設計全部開源了,並提供了詳細的教程,以及具有系統辨識功能的 ALOHA 2 MuJoCo 模型。
谷歌 DeepMind 放出了相關論文【ALOHA 2: An Enhanced Low-Cost Hardware for Bimanual Teleoperation】。
論文地址:https://aloha-2.github.io/assets/aloha2.pdf
計畫主頁:https://aloha-2.github.io/
我們先來一睹升級後的 ALOHA 2 能做些什麽,比如將不同的玩具放進三個不同的碗裏。
玩雜耍,你扔我接。
開可樂瓶並將可樂倒進別的杯子裏、開酸奶盒。
給熊貓玩偶戴上美瞳。
更難以想象的是,它還能變身扒手,悄無聲息拿走你的錢包,並給你放回去。
簡直絕了!ALOHA 2 顯著提高了一代 ALOHA 的耐用性,從而能夠在更復雜的任務上進行大規模數據收集。
相較於一代,ALOHA 2 都升級了些啥
為支持對復雜操作任務的研究,在 ALOHA 平台上擴大數據收集的規模成為目標之一,包括使用的機器人數量、每台機器人的數據收集小時數以及數據收集的多樣性。這一擴充套件過程改變了相對於第一代 ALOHA 平台的要求和範圍。
對於 ALOHA 2,除了在 ALOHA 平台的基礎上建設,研究者還針對以下領域尋求進一步改進:
效能和任務範圍:增強 ALOHA 效能的關鍵元件,包括夾持器和控制器,以實作更廣泛的操控任務。
使用者友好性和人體工學:為了最佳化大規模數據收集,優先考慮使用者體驗和舒適度,包括改進使用者介面系統的響應性和人體工學設計。
穩健性:增加系統的穩健性,最大限度地減少因診斷和維修造成的停機時間。這就需要簡化機械設計,並確保更大規模的機器人隊伍在整體上易於維護。
根據上述目標,ALOHA 2 的具體改進如下:
夾持器:研究者為領導機器人和跟隨機器人的夾持器設計了新的低摩擦軌域。對於領導機器人,這改善了遙操作的人體工學和響應速度。對於跟隨機器人,這改善了延遲和夾持器的力量輸出。此外,他們還升級了手指上的抓膠帶材料,以提高耐用性和抓取小物體的能力。
重力補償:研究者使用現成的元件建立了一個被動的重力補償機制,與 ALOHA 原有的抓帶材料系統相比,這提高了耐用性。
框架:研究者簡化了圍繞工作單元的框架,同時保持了相機安裝點的剛性。這些變化為人機協作者和機器人互動的道具提供了空間。
相機:ALOHA 2 使用更小的英特爾 RealSense D405 相機和客製的 3D 打印相機支架,以減小跟隨臂的占地面積,從而減少對操作任務的阻礙。這些網路攝影機還具有更大的視場角、深度、全域快門和更多的客製功能。
模擬:研究者在 MuJoCo Menagerie 中的 MuJoCo 模型中模擬了 ALOHA 2 機器人的精確規格,從而改進了數據收集、策略學習和模擬評估,以應對具有挑戰性的操縱任務。
夾持器
為了使遙控操作更順暢,並改善人體工程學,本次采用了低摩擦軌域設計,降低了機械復雜性,從而取代了 ALOHA 原有的剪刀導軌式機械手設計。
研究者設計並制造了低摩擦隨動機械手,取代了 ALOHA 最初的設計。較低的摩擦減少了領導機器人和跟隨機器人夾持器之間感知的延遲,顯著改善了遠端操作期間的使用者體驗。
框架
研究者重新設計了支撐框架,並使用 20x20mm 鋁型材將其制成。框架為領導機器人和重力補償系統提供支撐,並為俯視攝影機和蟲眼攝影機提供安裝點。
與 ALOHA 相比,本次設計進行了簡化,去掉了工作台與遙控操作員相對一側的垂直框架。增加的空間使數據收集方式更加多樣化。例如,人類協作者可以更輕松地站在工作區的對面與機器人互動,從而收集人機互動數據。此外,還可以在工作台前擺放較大的道具,讓機器人與之互動。
模擬
研究者釋出了用於 ALOHA 2 工作單元的 MuJoCo Menagerie 模型,它對於遠端操作和模擬學習非常有用。
與之前釋出的 ALOHA 模型相比,MuJoCo 的物理精度更高、視覺保真度更高,允許快速、直觀、可延伸的模擬數據收集。
MuJoCo 模型渲染。
模擬遠端操作任務。
以下為使用 Google Scanned Objects Dataset 與 MuJoCo 模型進行遠端操作的範例(1 倍速度):
更多細節內容請參閱原論文。