宇樹創始人王興興：多模態模型還非常糟糕

2024-07-15科技

在宇樹科技釋出人形機器人G1釋出的一個月前，波士頓動力也釋出了第一款純電驅動的人形機器人，也就是全新的Atlas。

「他們釋出的時候，其實我們公司內部非常開心。因為其架構跟我們的非常相像，這也間接說明，我們也做得比較好。」宇樹科技創始人及CEO王興興說道。

他順便還作出了澄清，表示宇樹不可能是學波士頓動力，因為大家此前都還不知道後者在做純電驅人形機器人。

在本月的WAIC上，王興興帶來了主題為【具身智能是實作AGI的最有效途徑】的報告，不僅對機器人產品進行了梳理，也對當下的AI發展發表了觀點。

由具身智能走向AGI

王興興指出，現在業界流行將神經網絡的規模做得更大，這本質上也確實很容易實作——隨著神經網絡的規模增大，智能水平越來越高，這是簡單明了的第一性原理。

但是，目前的大語言模型、多模態模型仍難以實作對整個世界的理解。

「模型對時間、空間和物理定律的理解非常重要，這對於動物和人非常簡單，但目前多模態模型還是非常糟糕的。」

之所以王興興相信「具身智能才是實作AGI最有效的途徑」，是因為依靠「軀體」收集的數據非常重要。

「只有部署到真實的機器人上去，參與到真實的世界中，去理解每個人的情緒，才能讓數據真正有效。」他指出，讓機器人理解人類情緒也非常重要。

在他看來，機器人在物理世界的全像采集、性格采集非常重要。因為人在解決吃喝拉撒等生理需求後，最大的需求就是情緒價值。

單純的大腦，只適合做夢

具身智能最大的點就是被賦予了軀體，而傳統的AI只停留在文字和影像上。

王興興認為，自然界有一些動物，之所以無法實作更復雜的任務，並非是由於大腦的智能程度不夠，而是身體構造限制了它們的發展。

「做夢的時候為什麽跑不快？因為這時大腦脫離了對身體的控制，腳步沒有接觸地面，也沒有任何反饋，所以永遠跑不快。」

這也體現出了具身智能對於AGI的重要性—— 單純一個「大腦」不頂用，它很容易活在「夢境」裏。

「像現在的大語言模型等等，很像活在夢裏面，有時也像是說夢話。可如果結合肉體和感知對世界的理解，它可以真正有活著的感覺，這也是體現了目前對具身智能的重要性。

王興興認為，知名學者李飛飛的「空間智能」與他理念接近，同樣是要推動AI與物理世界的互動，去彌補平面數據的不足。

「目前全球頂尖的專家都在推動世界模型的構建，這能讓機器人真正理解整個世界，而且是通用的世界。例如同一台機器人，今天可以在工廠幹活兒，明天就可以去你家裏做飯。」

機器狗與機器人

據王興興介紹，目前宇樹正在開發更復雜的整機運動。

盡管機器狗更容易做出復雜動作，但今年宇樹的大部份精力還是放在了人形機器人上。不過，機器狗倒是幫了人形機器人的大忙。

「很多人覺得機器狗和人形機器人差別比較大，但其實，不管從硬件角度還是軟件角度看，它們的相似度非常高。這也是為什麽我們去年花了半年多時間就可以造出第一台人形機器人。」

王興興表示，在國內做人形機器人的公司中，很多是借鑒了早些年四足機器人的硬件設計和軟件，包括深度強化學習算等。

他介紹稱，宇樹的機器狗是透過純端到端訓練的，即透過頭部的深度相機直接用神經網絡輸出關節扭矩，效果非常理想。

「大家可能想象不到，整個AI控制環路頻率沒有那麽高，大概只有幾十赫茲。」

王興興表示，在人形機器人運動控制上，可開發的事情還有很多。至少目前，人形機器人仍未超越人類。

在1-2年內，宇樹希望能讓人形機器人實作覆蓋全地形的、更高難度的動作，包括更復雜的舞蹈、跑酷等等；至於手部操作，機器人將承擔一些工廠或服務業工作，包括基於端到端AI訓練的導航、巡邏等等。

宇樹G1開始量產

去年，宇樹釋出了第一款人形機器人p，它跑步很快，還能實作原地空翻。而且它並沒有像波士頓動力那樣使用液壓，只是純電驅動。

這看起來簡單，但實際上對硬件、電池、電控系統和軟件要求都比較高，畢竟這台人形機器人有50kg+，1.8m高。

今年5月，該公司釋出了第二款人形機器人G1，這款人形機器人的體型相對小一點，高1.3m，但關節數量、關節自由度、關節運動空間，以及外觀都達到了頂配的級別，售價9.9萬元起步。目前它已開始量產，並開始接訂單。

「G1的關節都是內軸式的走線，所以整體更加整潔、幹凈。且關節運動量非常大，重量只有35kg，整套動作都是透過深度強化學習做的。」王興興介紹道。

AI領域，人人平等

目前，G1的整套運動控制演算法都是用深度強化學習驅動的。

「進步其實比大家想象得更快，我個人比較樂觀：最遲明年年底之前，全球肯定會出現比人跑得快的人形機器人，比如說很有可能100米跑進10秒。」王興興表示，人形機器人在體育專案和文藝演出上，會比幹家務進步得更快一些。

在談及當代AI熱潮時，他認為，AI不是傳統學科，沒有深厚的積累。目前在AI領域中，人人平等——大家要學的都是10年內出現的知識。

「目前AI還跟小學數學差不多，沒有想象的那麽難。AI的發展節奏跟數學領域的小學生的算術水平差不多。」

但他也覺得，當下是非常激動人心的時代，相比過去人類幾萬年或者幾千年的歷史文明，AI是更有意思的點。

「大家都很年輕，當下我們這個時代的人，未來5年肯定有很大的技術突破，最多絕不會超過10年。」