當前位置: 華文世界 > 科技

對話星動紀元陳建宇:具身智慧是人形機器人發展與套用的關鍵點

2024-08-30科技

作者| 金旺

欄目| 機器人新紀元

2024年8月19日,星動紀元官宣釋出新一代人形機器人——星動STAR 1。

與一年前公司成立時釋出的首款產品小星和小星MAX不同的是,這次星動紀元釋出的星動STAR 1是一款產品級人形機器人。

據星動紀元創始人、清華大學交叉資訊研究院助理教授陳建宇透露,"星動紀元團隊內部就多項指標對這代人形機器人進行了一系列的測試驗證,最終讓這代人形機器人達到了產品級標準。"

據悉,星動紀元團隊早在2022年完成了第一代人形機器人研發,在這之後不到兩年時間裏,他們的人形機器人進行了多次叠代,到前不久釋出的星動STAR 1,實則 已經是星動紀元團隊研發的第六代人形機器人

我們在上周的2024世界機器人大會(WRC 2024)現場,看到了星動紀元這款新產品。

據陳建宇透露,「星動STAR 1不僅各方面效能得到了極大的提升,還將AI與大模型技術套用到了這代人形機器人上, 實作了端到端的泛化行走與抓取 。」

此外,星動紀元也正在進行人形機器人的商業化探索,開始推動人形機器人在工業領域進行商業化驗證。

關於人形機器人的技術卡點和商業難題,我們在WRC 2024期間與陳建宇進行了一場深度對話,在這場對話中,我們了解到了他眼中的人形機器人的現在和未來。

01 操作大模型,提升泛化性

問:星動STAR 1在哪些方面得到了進一步提升?

陳建宇: 去年我們釋出的是第三代人形機器人,今年我們釋出了第六代(星動STAR 1),和去年的小星相比,今年的星動STAR 1的自由度從20個增加到了 55個 ,關節扭矩從去年的150N·m也提升到了 400N·m ,關節轉速達到了 25rad/s ,效能達到世界頂尖水平。

實際上,我們這代產品在軟硬體方面都得到了很大的提升。

硬體方面,包括靈巧手XHAND在內的所有核心零部件,我們都已經完成了自主研發。

軟體方面,去年我們采用的是傳統控制方法,只實作了人形機器人慢速行走, 現在我們采用端到端純學習方法,僅僅透過一個神經網路就實作了人形機器人在不同環境中的泛化行走和抓取

問:星動STAR 1是什麽時候立項的,這代產品研發過程中最難的是什麽?

陳建宇: 我們平均一代人形機器人產品幾個月就能叠代完成,而且這個叠代速度還在越來越快。

之所以產品叠代越來越快,是因為我們在人形機器人研發過程中積累了很多通用的技術,而且 我們在將這些技術能力逐步進行模組化 ,我們在研發星動STAR 1這代產品時,很多模組是直接從之前產品中復用而來。

就這代產品的難點而言,一方面是它的腿部效能達到了極致效能,另一方面是我們的靈巧手有了很大的改進。

問:現在人形機器人的標準化做得如何?

陳建宇: 現在已經有一些標準化組織在做人形機器人標準化相關工作,包括人形機器人的技術路線,有一些大家也開始達成共識。

就我們自身而言,我們的硬體技術路線,例如我們的關節技術演進路線,早在2022年就已經確定下來,我們的關節這幾年一直都在沿著我們最初制定的技術路線演進,如今這條技術路線也已經逐漸成為人形機器人產業的一個主流趨勢。

就靈巧手而言,現在很多整機廠商還都是外采,我們這次則 設計了一種全新的、可以很方便適用AI演算法的硬體架構 ,基於這一硬體架構,我們自研了靈巧手XHAND,我們這套架構在未來也很可能會成為人形機器人靈巧手新的共識。

問:星動STAR 1在運動控制領域是如何套用大模型的?

陳建宇: 我們研究了人形機器人的操作大模型,基於語言和視覺訊號的輸入,透過操作大模型讓人形機器人直接輸出動作,相較而言,這是一個端到端的語言-視覺-動作大模型。

透過大量的數據訓練,這樣的操作大模型具備較好的泛化性,這使得我們的人形機器人有了舉一反三的能力—— 在進入到一個新的任務場景中,我們的人形機器人只需要少量數據就能學會相關技能

這些都是我們在實驗中觀察到的現象。

例如在一個新的任務場景中,我們只對人形機器人進行了幾個簡單物品的操作訓練,之後我們發現, 人形機器人在面對更復雜的環境和物體時,在沒有進行針對性訓練的情況下就能夠準確地進行相應的操作,這就讓人形機器人具備了泛化性

問:操作大模型訓練數據是如何收集的?

陳建宇: 我們的操作大模型的訓練數據可以來自四個方面: 基於遙操作方式獲取的數據、基於仿真環境生成的數據、高品質的開源數據集 人類的運算元據

其中,人類的運算元據使用起來很有難度,我們現在也在想辦法把這類數據利用起來,這就需要我們在演算法底層做創新和改進。

02 人形機器人的具身智慧瓶頸

問:人形機器人套用的瓶頸,是缺少剛需場景,還是技術不夠成熟?

陳建宇: 兩方面其實都有。

人形機器人是一個全新的產品品類,這類產品的套用需求確實需要大家去探索,技術方面的話,也確實需要得到進一步發展。

大家剛開始做這件事沒多久,包括我們第一代人形機器人也是一個相對簡單的形態,經過這兩年六代產品的叠代,我們的人形機器人在行走能力方面走得越來越快、越來越穩,手部的操作也越來越智慧,能夠做更多事情。

實際上, 人形機器人技術發展到現在已經初步具備在一些簡單場景中執行任務的能力

問:人形機器人技術發展瓶頸在哪裏?

陳建宇: 未來人形機器人的具身智慧如何去做,這是最大的不確定性。

就如何實作通用的具身智慧,目前最前沿的學術界都還很難回答這一問題

我們已經看到很多技術路徑,這些技術路徑都有可能成為未來通用智慧的可能性,我們團隊現在也在不同路徑上做相應的探索,這是我們未來的有利競爭。

問:怎麽看現在人形機器人技術發展速度?

陳建宇: 現在人形機器人技術發展非常快,以往人形機器人的研究方法,是以線性增長的趨勢推動整個產業發展,現 在在數據驅動的時代,整個產業有了階躍式發展的可能

所以,人形機器人完全有可能以超出大家預期的速度發展。

對於人形機器人產業的發展,我會更樂觀一些,很多人看到的是人形機器人現在能做什麽,這些能力距離他們心中理想的人形機器人形態還有多遠,但我看到的是以後人形機器人會發展成什麽樣。

問:星動STAR 1有怎樣的商業計劃?

陳建宇: 我們會先就我們的靈巧手XHAND進行商業化,我們的靈巧手也會根據市場需求進行後續的產品叠代。

至於星動STAR 1人形機器人,我們是按頂配效能來做的,相當於汽車中的保時捷,但由於我們自下而上進行了全棧的技術自研和供應鏈把控,因此它的最終售價也不會特別貴(具體價格我們會在後續公布)。

為什麽我們會強調人形機器人的效能?

這是因為我們希望我們的人形機器人真可以去幹活兒、甚至幹人幹不了的活兒,這就需要人形機器人在力量、效率上都有很好的表現。

03 工業依然是第一場景

問:人形機器人最早的商業落地場景是什麽?

陳建宇: 我認為人形機器人 最先會落地在工業領域 ,這是基於以下三個判斷:

第一,工業是一個勞動密集型產業,而且正在面臨勞動力短缺的問題;

第二,我們做過一個估算,人形機器人在工業領域得到大規模套用後,它的成本能夠完全得到覆蓋;

第三,對比家用或服務類套用場景,工業場景對人形機器人的套用需求,實作起來的技術難度會相對低一些,相對更容易實作。

基於以上三點判斷,我們現在主要也是在工業領域做人形機器人的技術和產品驗證。

問:人形機器人已經到了賣貨階段了嗎?

陳建宇: 目前大家已經在賣貨的人形機器人,不會是最終真正大規模套用的人形機器人

我們看到,馬斯克在推動人形機器人進汽車工廠,他對於人形機器人商業化落地的判斷,是基於他們真正在汽車工廠中解決了哪些問題、真正做到了哪些工人在做的事情提出的,他們人形機器人量產時間線也是基於在實際工廠場景套用情況制定的。

但是 目前大家還沒有真正找到一個引爆需求的場景 大家正在賣的人形機器人也並不是為了滿足真實市場需求而做的,更多是為一些早期嘗鮮者提供,所以由此產生的銷量不會很大

對於我們而言,我們也會為早期嘗鮮者提供人形機器人產品,在這方面,我們確實也接收到了一些需求,但要真正推動人形機器人量產,一定要解決諸如工業場景這樣足夠大的場景中的某些需求。

只有真正滿足了這類需求,能夠提供一個有價值的解決方案,我們才能將人形機器人順利部署下去,從而推動人形機器人實作規模化量產。

問:人形機器人什麽時候能夠規模量產?

陳建宇: 我覺得大家現在暫時不用過於重視人形機器人量產這件事,現在人形機器人真正的問題不是量產,而是:

第一,現在生產出的人形機器人是否能夠真正被用起來;

第二,這些能夠被用起來的人形機器人所需要的技術,是否真能夠匯入規模化量產的產品中。

也就是說, 人形機器人的客戶需求在哪裏,你的技術是否能夠達到客戶的需求,這是我們開啟人形機器人規模化量產的先決條件

問:人形機器人要量產,在技術上還有哪些瓶頸?

陳建宇: 現在人形機器人最大的技術瓶頸依然在具身智慧。

硬體決定了人形機器人套用落地能力的上限,但是目前人形機器人產業擁有的硬體基礎支撐起來的套用上限,具身智慧演算法還暫時沒有達到。

也就是說,人形機器人的硬體基礎本身能夠支撐它完成的一些任務,由於現有AI演算法的能力不足,目前的人形機器人還無法真正實作這樣的產品力。

具身智慧技術的發展不如人形機器人硬體成熟,也就成了現在人形機器人產業最大的卡點