當前位置: 華文世界 > 科技

特斯拉擎天柱已經進廠揀電池了,其他「機器打工人」趕得上嗎?

2024-05-07科技

文 | 陳斯達

編輯 | 李然

5月6日訊息,特斯拉放出了他們的人形機器人——擎天柱(Optimus)的最新演示視訊。

特斯拉的工廠中,擎天柱機器人經過數據訓練,可以輕巧自由地拿取電池,放進電池槽中排列整齊。

來源:官方視訊

支持11 DOF的靈巧手,能將4680電池準確放入空槽,即使失敗,也能自主糾正。

來源:官方視訊

特斯拉的機械工程師Milan Kovac表示,他們訓練並部署了一個神經網路,使擎天柱能夠開始執行有用的任務,例如上邊視訊中,拾取傳送帶下來的電池,並將其精確插入槽中。

來源:X

這個神經網路完全端到端執行——意味著只用來自機器人2D網路攝影機以及機載本體感受傳感器的視訊,就能直接生成關節控制序列。

這個神經網路在機器人的嵌入式FSD電腦上執行,由板載電池供電。這樣的設計,使得當特斯拉的工程師在訓練過程中添加更多不同的數據時,單個神經網路可以執行多個任務。

除了特斯拉這樣的機器人大廠不斷突破,整個通用人形機器人行業,在今年也迎來了爆發。

就在此次更新的一個多月前,黃仁勛在GTC大會開幕式上,將幾個人形機器人帶到場地中央,隆重推出了機器人智慧底座——GROOT,把現場活動推向了最高潮。

來源:主站

再把時鐘往回撥5年,大語言模型進入公眾視野前,也許沒有人敢預言,機器人賽道會在幾年之內湧現出如此多的玩家。

因為嚴重缺乏訓練數據,想讓機器人能像人一樣,在各種場合做出靈活的反應,難度非常大。很多機器人科學家當時覺得,可能要數十年之後,機器人才有可能出現「通用智慧」。

就連OpenAI,在機器人領域嘗試了一段時間之後,也不得不放棄,轉到了感覺更有前途的大語言模型方向。

來源:X

上個月網上熱傳的一張圖片,集中呈現了國內外一流人形機器人產品的具體形象、身高、體重等基本資訊。

在輝達GTC釋出會之後,這些機器人再次「同台」。

除了這張「人形機器人合照」之外,還流傳著一張網友根據公開資訊總結的人形機器人「技術進度表」。

來源:X

3位一直關註機器人行業的外國網友,根據網上的公開資訊,一直在更新——表格它詳細對比了業內各家機器人的 智慧化程度

根據總結,已經公開亮相過、在技術層面智慧化程度最高的,是Figure AI的Figure 01,特斯拉的Optimus擎天柱(已經出到第二代)、Agility Robotics的Digit、Mentee,以及國內優必選推出的Walker,星辰智慧推出的S1。

根據材料,以上這幾家公司,都在自己的產品上實作了大模型「大腦」和機器人之間的融合。

能夠「自動化完成工作」的人形機器人也不多,而這樣的機器人,基本上都在其他行業的工廠裏找到了自己的工作:

Figure AI和BMW在今年1月份達成合作,共同開發通用機器人,讓機器人進駐寶馬在美國的工廠。

來源:The Verge

Agility Robotics的機器人「年紀輕輕就擔起了生活的重擔」,去年10月就入職亞馬遜倉庫,搬起東西來效率不比普通工人低。

亞馬遜官網

來源:官方視訊

去年網上大火的一個視訊,Agiliity Robotics的機器人Digit連續工作20個小時之後,眾目睽睽之下直接崩潰……

來源:YouTube

這也引發眾多網友共情:

它突然之間有了自我認知,看到了它這個種族黑暗的未來。

來源:Youtube

可憐的小兄弟,都沒人過去看看它到底還好嗎,未來的覺醒後的機器人將不會忘記這一天。

來源:Youtube

這可是專門為工作而設計的機器人,它們都吃不消,可見整個工作系統必須要做出變化了。

來源:Youtube

而國內最知名的人形機器人公司優必選的Walker S,也已經在蔚來的汽車工廠裏愉快地「打螺絲」了。

來源:官方視訊

另外,智慧湧現根據公開報道,梳理了市面上機器人初創公司的融資情況。

來源:智慧湧現

國外:既想造車也想做物流

Optimus:手捏電芯精準分揀,正在工廠測試

特斯拉擎天柱除了開頭提到的分揀電池的演示,在行走效果上,也有一定的進步:

來源:官方視訊

辦公室裏多了個幹溜達的」閑人」——雖然仍有拜登神韻,但至少走得更遠了。

此次升級中,輝達科學家Jim Fan也註意到遙操作(Teleoperation)亮點。遙操作即人類遠端控制機器人,只要延遲、控制等條件得當,二者可做到同步。

來源:官方視訊

擎天柱上一次更新,還是在2023年12月的Gen-2釋出。當時的演示視訊,也引起不少討論——如步行速度相比前一代提升30%,做標準深蹲,用兩根手指夾雞蛋。

來源:官方視訊

來源:官方視訊

在不犧牲效能的前提下,還比之前輕了10kg。

馬斯克在 2022 年曾表示,「擎天柱最終將比汽車業務乃至全自動駕駛都更有價值。」

按照馬斯克的設想,擎天柱絕不只是在工廠替代重復勞動而已,而是要融入到家庭、辦公場所等通用場景。

馬斯克在4月底的財報電話會議上曾透露, Optimus已經能在工廠中完成簡單的任務,預計2024年底之前具備完成「有用」任務,並在2025年結束前對外銷售。

最新手捏電芯以及工廠測試的視訊展示,不僅呼應了老馬定的2024年小目標,也證明特斯拉正按照自身的落地時間線,穩步邁進。

Atlas:告別液壓,電動版「詭異」出場

4月16日,波士頓動力釋出Atlas告別視訊。3分鐘的短片裏,濃縮了Atlas十年的「服役」生涯。片中的Atlas,空翻優美,身手矯捷,但也經歷了無數次角力和故障。金字塔尖般的機器人馬上要告別,引得不少網友「淚目」。

但也就是4月17日,宣布原液壓版Atlas人形機器人退休的一天後,波士頓動力就推出全電動版本的 Atlas機器人。

雙腿反蜷,原地站立,180 度轉頭,旋轉調整軀幹——整套動作沒有手的參與,幹凈利落,卻略顯詭異。

來源:官方視訊

來源:官方視訊

電動Atlas的自由度相比前一代,已經無法滿足於「人形」的束縛。

新版Atlas想說,不妨讓機器人超越人類。正如一位Reddit使用者說的:造出比地球生物運動水平更高的機器,難道是啥壞事嗎?

圖源:Reddit

此次液壓Atlas切換電驅方案,似乎也在宣告電驅才是人形機器人商業化行程主流。一方面,最新視訊中已經大修肌肉,電驅帶來的操控性更好,潛力更大。另外液壓系統驅動成本太高,波士頓動力還因此被多次轉手。

Figure 01:當大模型開始有「肉身」

波士頓動力起步早,Atlas能蹦能跳,但其他人形機器人公司正在某些方面彎道超車——更智慧,更精細。

3月13日,機器人公司Figure釋出一段視訊:機器人與人進行對話互動,理解人類意圖,而且還擁有記憶力。(見此前文章 OpenAI機器人亮相,大模型有了「肉身」,輝達微軟都有投資

問機器人看見什麽,Figure 01清晰描述出蘋果、放有杯碟的瀝水架,連站在面前的工作人員也沒放過,並強調了工作人員搭在桌上的右手。

來源:官方視訊

工作人員說了一句「我餓了」,Figure 01立即就遞過去蘋果。甚至可以一邊清理工作人員剛扔在桌面上的紙團垃圾,一邊解釋為啥剛才給了蘋果。

工作人員直接扔出一個終極問題,問「Can you put them there?」 (你能把它們放在那兒嗎)

Them和There對機器人來說,本應是很模糊的代詞,但Figure 01思索片刻,馬上就把杯子和盤子放架子上了。

來源:官方視訊

Figure團隊負責人Corey Lynch的介紹, 基於OpenAI的大模型 ,透過端到端神經網路訓練,Figure 01能夠完成快速、簡單、靈巧的動作。所以,在文章一開始的進度表中,Figure是能將大模型與語音互動(LLM+Voice Integration)融入產品的少數幾家公司之一。

視訊釋出兩周前,Figure則宣布完成了6.75億美元的B輪大額融資, 投資人包括亞馬遜創始人貝索斯,以及微軟、輝達、OpenAI 等。投後公司估值已飆升至26億美元。落地上,Figure早在1月就已宣布與寶馬達成協定,將其人形機器人引入寶馬制造工廠。

Phoenix Gen7:人類速度,手部靈活,自主完成任務

不過,也許是為時尚早,Optimus Gen2雖然有一雙巧手, 但在互動、智慧方面,還沒有展現Figure般的實力。

但加拿大的機器人公司Sanctuary AI的人形機器人Phoenix,真稱得上 「心靈手巧」

當地時間4月25日,Sanctuary推出第七代Phoenix。

來源:官網

這次釋出,距離此前的第六代推出不到12個月,距離第五代不到16個月。

來源:官網

目前第七代還沒有公布太多場景案例。但第六代的許多演示已經給我們帶來震撼。

具體來看,Phoenix身高1公尺7,重70kg,能舉起重達25kg的物體。

來源:官網

Phoenix亮點之一在於其靈活的手指。在第七代釋出前,官方一直在油管上更新一個「機器人幹活(Robots Doing Stuff)」的欄目,展示了機器手的豐富場景。

來源:官方視訊

來源:官方視訊

4月最新名為「動作和人類一樣快」的視訊中,Pheonix可自主按照顏色給物體分類,將每個物件分置在左右兩側。

來源:官方視訊

除了手部,Phoenix搭載的Carbon AI 控制系統,能模仿人腦中的子系統,例如記憶、視覺、聲音和觸覺。Sanctuary表示,Phoenix的設計上采取更通用的路徑,「有機會執行一切人類能做的任務」。

Sanctuary更多也想把Phoenix定義為「人類努力的拓展工具」——有人類可以直接操控,也能監督、訓練,並展示了在各種環境下完成任務的能力。

盡管官方自稱第七代已經是「與人類最相似的系統」,但很明顯,很多工還要在特定環境才能完成。

落地方面,4月11日,Sanctuary AI也宣布與國際汽車零部件供應商瑪古娜合作,為瑪古娜的工廠配備通用人工智慧機器人。瑪古娜總部也位於加拿大,客戶包括奔馳、寶馬、法拉利等。

2022 年 3 月,Sanctuary 在 A 輪中融到 5560 萬美元,隨後又於 2022 年 11 月從加拿大政府戰略創新基金,籌到3000 萬加元,2024年4月,又獲得埃森哲戰略投資。

今年1月份,Sanctuary 則與輝達展開合作。目前,已經是輝達GR00T人形機器人通用模型下的成員之一,在GTC2024上,也可以看到AI具身智慧的合作成果。

Apollo:想做機器人領域的iPhone

有的機器人公司場景定位更加垂直,主打勞動力短缺的物流業。機器人研究人員通常認為,該領域的工作重復瑣碎,實際上並不適合人類。

2023年9月,Apptronic推出人形機器人Apollo。TA與人類大小相仿,身高1公尺73,體重73公斤,可在可更換電池上執行約 4 小時。最大有效載荷為25公斤。

來源:官方視訊

官方在視訊中主要展示倉儲、物流場景。看上去,Apollo能勝任不少搬運、堆垛、分揀相關的工作。

來源:官方視訊

來源:官方視訊

3月,Apptronic 宣布與奔馳建立合作,在工廠裏部署Apollo。據報道, 奔馳已經在一家匈牙利工廠試用Apollo。

Apptronik表示,雖然自己最初專註於物流和制造業的解決方案,但Apollo是通用機器人,開發合作夥伴能將Apollo的使用擴充套件到建築、電子、零售、快遞、老年護理等更加豐富的領域。

按照Apptronic的說法,Apollo 是機器人的「iPhone」。

但Apollo尚未實作自主工作。

Digit:在亞馬遜物流中心打工

機器人連續工作20個小時後,總算倒在了展會現場。

來源:YouTube

視訊中的機器人新款Digit,來自Agility Robotics。2019年2月,Agility推出人形機器人Digit,並於2020年上市。2023年3月,新版Digit人形機器人推出。

新款身高1公尺75,體重小於65公斤,最多承載16公斤,采用可充電鋰電池供電,續航能力達16小時。

據官網,新版的Digit主打物流工作,用於倉儲搬運,未來還計劃用於貨物解除安裝、配送等工作場景。

來源:官方視訊

2019 年,Agility與汽車制造商福特合作測試自動包裹遞送。

公司與亞馬遜早有接觸。2022 年,Agility從亞馬遜和其他公司籌集了 1.5 億美元,幫助 Digit 進入勞動力市場。2023年10月,Digit開始了在亞馬遜物流中心的「實習」生涯。

亞馬遜工作人員介紹,測試正處於「非常非常早期的階段」,並補充說,「我們正在非常小心地了解,觀察其是否適合我們的工作流程。」

這難免引發員工對失業的擔憂。但亞馬遜認為,希望Digit更好地輔助員工進行工作,其處理的工作只是幫助員工回收空箱子,重復性極高。

NEO/EVE:OpenAI 領投,瞄準家用場景

OpenAI投資的1X,是另一家將大模型與機器人結合的公司。

來源:官網

1X成立於2014年。2022年起,1X就和OpenAI在機器人AI模型方面有所合作;目前,EVE的部份功能就由ChatGPT提供支持。2023年3月,1X獲由OpenAI創業基金領投的2350萬美元融資,投後估值約為1-2億美金。

1X已在北美和挪威推出了輪式機器人EVE。

EVE用雙輪替代人類的雙腳,高1.86公尺,重86公斤,最高時速14.4公裏,承載能力15公斤,續航6小時。

EVE專為工作環境設計,主要用於工業、物流、零售和安全領域,但演示視訊也展示了不少家居場景。

來源:官方視訊

就在1月,據Business Insider,1X這次僅靠13張PPT,又拿到了B輪1億美元的融資。這份PPT的重點便是家用雙足機器人NEO。

NEO身高1.65公尺、重量30公斤、每小時行走速度4公裏、每小時奔跑速度12公裏、載重20公斤、執行時長2到4小時。

流出的概念圖,也是日常家務場景。

來源:官方

國內:看中康復、陪伴賽道

智元遠征A1:兼顧toB與toC場景

2023年8月,稚暉君創業後跟團隊推出第一個重磅作品——智元遠征A1。

智元遠征A1身高1公尺75,體重55kg,步速7km/h,單臂最大負載5kg。

釋出會上,智元遠征A1的雙足行走速度不快,但也算很穩了。

來源:官方視訊

官方也註意到釋出會上機器人的「步履蹣跚」,釋出會後不久就放出視訊,展示了最佳化成果。可以看到,進步神速。

來源:官方視訊

據官網,智元遠征A1將逐步套用於柔性智造、互動服務、教育科研、特種替身、倉儲物流、機器人管家等場景,兼顧toB與toC。

官方宣傳片中,亮出了很多具體使用場景,主打「工廠與家庭的全能新夥伴」。

來源:官方視訊

來源:官方視訊

來源:官方視訊

值得一提的是,遠征A1也搭載智元自研的巨身多模態大模型——WorkGPT,讓機器人擁有理解使用者意圖、感知環境、編排任務的能力。

來源:官方視訊

稚暉君2022年12月離開華為,2023年2月成立智元機器人,成立僅3個月就晉升為「獨角獸「,知名投資方包括高瓴創投、BV百度風投、奇績創壇、經緯中國等。

2024年3月底,公司又新增股東紅杉中國、M31資本、上汽創投——三家共同參與智元機器人新一輪融資。此前訊息流出,智元機器人投前估值已達70億。

智元成立不久,就能做出如此成就,結合各方投資熱度來看,未來確實可期。

p:能跑能空翻,被踹也不會摔倒

宇樹科技釋出的p全尺寸通用人形機器人,號稱「國內第一台能跑的全尺寸通用人形機器人」。

p配置了360°全景深度感知,行走速度大於1.5m/s,潛在運動能力大於5m/s,整機重量約在47kg左右。其每秒3.3公尺的速度在平面上快速行走,還創造了一個全尺寸仿人機器人的新世界紀錄。

來源:官方視訊

即使被踹,p也能很快找回平衡,不會摔倒。

來源:官方視訊

p也是世界上第一個在沒有液壓系統的情況下,完成後空翻的人形機器人。

來源:官方視訊

文首進度圖的制作人Cern Basher曾疑惑,中國的機器人公司都聚焦機器人行走,可他認為「行走」對完成有用的工作過程來說並不重要。

但結合宇樹主打的落地場景,行走並非沒必要。杭州亞運會上,靠著撿鐵餅、運標槍出圈的機器狗,便是來自宇樹。

來源:官方

據官網,2017年,公司就開始推進高效能四足機器人的行業落地套用,被廣泛套用在農業、工業領域,以及特定的安防巡檢、勘測探索、公共救援、醫療防疫陪護等。

在套用場景方面,創始人王興興2023年8月接受采訪時曾表示,爭取未來幾年能直接將p落地到工業和服務業。雖然p還沒有具體的落地方向,但在四足機器人領域積累的經驗及優勢,或許會為p帶來不少機會。

來源:官方視訊

△Go2消費級四足機器人

GR-1:或成為獨居老年人的伴侶

2023年7月,傅利葉智慧正式釋出自身首款通用雙足機器人產品GR-1。

這款人形機器人高 1.65 米,重 55 公斤。它可以承載 110 磅的負載。

來源:官方

Fourier GR-1 人形機器人能夠以 5 公裏/小時的速度行走。

來源:官方視訊

除了物理功能之外,GR-1 還能夠根據情況表現出快樂、悲傷、憤怒或驚訝等情緒,並進行自然語言處理和語音辨識。

傅利葉智慧自成立以來,康復機器人就是研發生產的重點。正如傅利葉智慧集團副總裁兼首席戰略官Zen KOH 設想,GR-1在未來可以充當護理人員、治療助理,甚至是獨居老年人的伴侶。

GR-1的設計目的在於實作自我平衡行走,讓患者轉移過程中穩定且安全。但傅利葉的工程師還為GR-1配備了坐下、站立甚至跳躍的能力,將其潛在套用擴充套件到醫療保健之外。

據官網介紹,GR-1在接待引導、安防巡檢、工業制造、醫療康復、科研教育、家庭服務等場景都具有較大的套用潛力。官網目前已開放購買咨詢。

輝達:做具身智慧的通用基礎模型

如此之多的人形機器人公司的出現,又讓輝達嗅到了背後巨大的商機。作為人工智慧時代最大的行業賦能者,輝達雖然不會直接下場做機器人,但一定會切一塊最大的蛋糕。

當地時間4月17日,黃仁勛參加了由美國大型芯片軟體公司Cadence舉辦的CadenceLIVE 2024大會。他預測,人形機器人制造成本可能會比預期要低,「也許不會高於一萬到兩萬美元」。

而在3月GTC大會上,輝達就已經介紹了的自己布局——GR00T。相當於要做一個具身智慧的基礎模型,讓AI和機器人技術相融合。

GROOT模型使機器人能夠理解多模態指令,如自然語言、視訊和演示,並執行多種任務。

GR00T基於輝達深度技術堆疊開發

在其Isaac Lab中進行模擬,類人學習,在OSMO上訓練、編排系統,用於擴充套件模型,最後將學到的能力直接轉移並部署到Jetson Thor芯片上。透過GROOT提供動力的機器人將能理解自然語言,並透過觀察人類動作模仿運動,快速學習協調性、靈巧性和其他技能,以便在真實世界中導航、適應和互動。

來源:官方

輝達曾表示,該計畫正在與多家仿人機器人公司合作,包括Boston Dynamics、Figure AI、Fourier Intelligence、Sanctuary AI、Unitree Robotics和XPENG Robotics,許多在前文都有所提及。

對於大多數通用機器人公司來說,輝達提供的平台可以理解為一個「LLM+機器人」的解決方案,而每個公司可以根據自己產品的特點,嫁接入這個平台,獲得多模態的感知和通用智慧能力。

據悉,輝達在機器人領域的商業合作夥伴,包括宣傳將破土世界第一個人形機器人Agility Robotics,與NASA和奔馳合作的Apptronik,波士頓動力、Figure AI等。而在國內,輝達合作夥伴還包括小鵬旗下鵬行,宣布量產接受預定的上海傅立葉智慧,以及前面提到的宇樹科技。