當前位置: 華文世界 > 科技

中國首個通用泛化機器人終於來了!清華校友打造中國版Figure 01

2024-09-03科技

編輯:編輯部

【新智元導讀】 中國首個擁有真正意義多工連續泛化具身模型的機器人,誕生了!這個機器人,是真正由模型訓練出來的,據了解,截止目前除了Figure 01,國內似乎還沒有第二家能做到這種級別的泛化能力,即使被百般刁難,都能完成任務。清華校友下場創業,才4個月就已融資近2億。

剛結束的世界機器人大會,余熱未消。

各家機器人展示的花活,令人眼花繚亂。

然而大概所有逛展的人都有這樣一個感觸:目前全世界範圍內,真正擁有強大泛化能力、能應對各個場景的機器人,依然寥寥無幾。

中國廠商中是否有哪家機器人,能夠實作真正的多工連續泛化能力?

還真有!訊息靈通的我們打聽到,一家名為「千尋智能 Spirit AI」的具身智能公司,已經首次展示出了強大的多工連續泛化能力。

據說這家神秘的公司成立時間並不長,卻展示出了如此級別的技術進步,他們究竟是怎麽做到的?

最近,我們去探了個廠,詳細記錄下了那些驚掉我們下巴的瞬間。

所有動作均由神經網絡自動生成

怎麽刁難都不怕,動作無比絲滑

在研究人員的配合下,我們現場錄制了一番demo。

拿著白色紙杯的小哥走近機器人,並行出請求「一杯意式濃縮」,忙於看手機資訊的同時,他卻不小心把杯子弄翻了。

來看看,千尋的機器人會怎麽做?

只見,它自如地用一只手將紙杯擺正。

所有動作均由神經網絡自動生成

然後用另一只手將其放在咖啡機上,按下功能鍵。

所有動作均由神經網絡自動生成

等咖啡做好之後,再將盛滿咖啡的杯子放到桌子中間,任務就大功告成了。

所有動作均由神經網絡自動生成

接下來過來的這位小哥,想要一杯卡布奇諾。

不過這次,換的是一個透明的玻璃杯。

而就在機器人快要夠到杯子時,小哥還有意「刁難」它,快速把杯子移走了。

所有動作均由神經網絡自動生成

面對這種刁難,機器人表示完全沒問題!

端到端神經網絡強大的泛化能力,讓機器人能精準辨識透明反光物體,無論杯子放到哪裏,它的「夾子」手都能輕松hold住。

接下來,我們出場了,決定給它來個高難度的任務。

先隨手在機器人一只手旁擺放一個紙巾盒,再將紙杯子緊挨紙巾盒放置,並要求「來一杯美式」。

沒想到,它一眼辨識出身旁的障礙物,並將其移到一旁,成功取到了杯子。

所有動作均由神經網絡自動生成

最後,我們喝到了機器人制作的美式。

更驚喜的是,我們還在現場意外地發現:千尋機器人的「夾子」手也可以更換成靈巧手!

它不僅精準拿起蘋果,還可以將其顛起,精準拿住。

而且,據稱無論是什麽樣的手——兩指、三指、五指,都可以實作連續多工泛化。

看到這兒之後,我們瞬感驚艷,可以暢想出千尋機器人走進家庭的未來,憑借強大的泛化能力,幫助人們完成各種各樣的任務。

所有動作均由神經網絡自動生成

緊接著,我們紛紛湧向會議室,好奇地問道,「千尋機器人究竟是如何實作如此完美地連續泛化能力」?

豪華創業團隊,全棧AI配齊

這家堪稱「中國Figure」的具身智能公司,智囊團在世界範圍內也算是極其稀缺的。

幕後技術團隊紛紛出自 UC Berkeley 、CMU、NTU、清華、北大、浙大、華為、騰訊、大疆、小米等國內外頂尖高校、企業。

在具身大模型、機器人研發,以及實際落地上,這支融合學術精英與業界翹楚的團隊,展現出了卓越的實力。

他們不僅有著基座模型預訓練、RL、IL等核心技術力,還在機械臂系統設計、機器人安全、控制架構等方面身處行業前沿。

正因如此,千尋智能才得以具備全棧的AI工程化能力。

一起來認識下,這支星光熠熠的領軍團隊,都有哪些關鍵人物。

創始人兼CEO韓峰濤

創始人兼CEO韓峰濤,師從機器人學術泰鬥丁漢院士,在機器人領域中深耕十余年。

他曾任珞石機器人聯合創始人&CTO,是國內高效能輕型工業機器人領軍者和國內力控協作量產交付第一人,帶隊成功交付數十款型號的產品超20000台。

值得一提的是,這些產品還獲得了43項國內外認證,其中包括全球僅有兩家、國內唯一的醫療方向IEC60601安全認證。

而且,整機的自主化率達到了90%以上。

在產品套用方面,韓峰濤博士帶領團隊落地20+行業、100+場景,1000+客戶的商業化成果轉化。

除了豐富的實踐經驗,他還積極參加許多國家級科研專案。

今年2月,韓峰濤博士創辦了千尋智能Spirit AI,致力於打造行業領先的通用機器人AI系統與人形機器人。

首席科學家高陽

而在AI能力方面,就不得不提另一位核心人物——首席科學家高陽,也是千尋智能的聯合創始人。

他本科就讀於清華電腦系,師從國內ML領域享有盛譽的著名學者朱軍教授。

憑借出色的表現,他獲得了UC Berkeley電腦系的全額獎學金,攻讀電腦視覺博士學位。

這期間,高陽師從國際電腦視覺大師Trevor Darrell教授(曾培養了包括賈揚清在內的多位視覺領域知名學者)。

此外,在讀博士、博士後期間,他曾與機器人學習領域的頂尖學者 Sergey Levine 和Pieter Abbeel教授有深入合作。

Pieter Abbeel是擴散模型(Sora、SD背後核心技術)的提出者之一。

爆火AI搜尋初創Perplexity AI的創始人Aravind Srinivas,以及前OpenAI聯創John Schulman,皆是他的學生。

論文地址:https://arxiv.org/pdf/2006.11239

此外,Sergey Levine教授是美國Physical Intelligence (Pi)的創始人。Pi是美國具身智能領域的頭部公司,獲得OpenAI等公司共計7000萬美元的天使投資。

就讀博士期間,高陽在AI頂會CVPR上,曾發表了一篇大規模現實世界數據的端到端自動駕駛論文。

這為後來的端到端自動駕駛,如FSD等,奠定了學術基礎。

論文地址:https://www2.eecs.berkeley.edu/Pubs/TechRpts/2020/EECS-2020-5.pdf

在個人貢獻方面,如上介紹的所有機器人背後核心技術,皆有首席科學家高陽的貢獻。

他在具身智能的三層模型中,取得了豐碩的研究成果。

在強化學習方面,高陽提出了世界上迄今為止,樣本效率最高的強化學習演算法 EfficientZero 、EfficientZero v2。

EfficientZero曾被前OpenAI聯創、強化學習帶頭人John Schulman,賦予了高度評價。

在模仿學習方面,他提出了EfficientImitate高效能模仿學習演算法,相比史丹佛的VMAIL提升了600%效能。

此外,高陽從利用互聯網影片以及預訓練VLM角度,提出了ViLa和CoPa模型。

在硬件方面,千尋智能也是這一賽道中的佼佼者。

團隊不僅具備了世界一流的機器人運動控制系統開發能力,還具備了一流的系統級機電系統設計能力

最重要的是,他們已經在工業機器人、醫療機器人方面,有著豐富的經驗,在技術上實作「降維打擊」。

總言之,千尋智能在軟硬件方面所具備的領先優勢,也成為持續吸引、贏得資本青睞與押註的關鍵因素。

所有動作均由神經網絡自動生成

4個月,融資2億

這次千尋智能Spirit AI的天使輪融資,由弘暉基金領投,達晨財智、 千乘資本 跟投,同時,順為資本和綠洲資本作為種子輪老股東也在持續加碼。

現在,具身智能的下一個爆發點就在眼前。在商用服務和家用服務上,可能批次落地就在3到5年內了。

從工業到服務,再到家庭套用,一個亟待開拓的萬億級市場,正在所有人眼前展開。

憑借業界領先的具身大模型技術,和卓越的機器人研發能力,千尋智能將以最高效率完成從技術研發到產品市場化的商業閉環。

通用機器人成為人類的親密夥伴,即將從科幻走入現實,整個世界已經開始走進智能機器人時代。機器人像iPhone手機一樣人人可用的時刻,或許就在眼前了!

而看完了機器人自主做咖啡,我們對千尋智能打動投資人的理由,也就有了更多具象化的理解。

在弘暉基金投資團隊看來,具身智能是AGI的重要套用場景,市場空間極為廣闊。

在過去,機器人的操控依賴大量人工編程流程,對場景有諸多限制。而具身大模型演算法與硬件結合而成的智能體,相對傳統機器人會在任務泛化性上有極大的提升。

這類智能體,會是通往空間智能的最佳路徑。而中國在機器人硬件產業鏈上,具備領先優勢。

團隊非常期待,新一代智能機器人的量產指日可待,掀起一場新的工業革命。

順為投資團隊非常看好千尋智能創始團隊的復合背景和行業經驗。同樣,綠洲資本投資負責人也表示,千尋智能的隊伍既結合了產業理解,還積累了前沿技術。也是因此,才讓我們見證到了公司在短期內的高效成長和叠代。

達晨財智投資團隊則肯定了千尋智能在行業內的稀缺性——這樣一個團隊,是同時具備機器人硬件、具身AI演算法能力以及商業化經驗的老炮團隊,緊密結合了過往的機器人工程化理解和前沿學術積累。

才短短半年,公司表現出的具身大模型以及快速的軟硬件叠代能力,無不令人印象深刻。

而千乘資本投資團隊對千尋智能表示出了強烈的信心。

在他們看來,AI大模型的革命性突破,賦予了機器人更多的智能性和敏捷性,展現出通用和泛化能力。

在人形機器人這個下一個萬億級別的大賽道,千尋智能無疑站在了行業的前沿。