當前位置: 華文世界 > 科技

具身智能奇異點將至,人形機器人哪些要點值得關註丨調研筆記

2024-08-25科技
人形機器人作為具身智能的優質載體,受益於AI(人工智能)技術的快速突破,擁有感知、思考、決策等能力不再遙不可及。這也加速了人形機器人逐步走向產業化階段。
2024年世界機器人大會以「共育新質生產力,共享智能新未來」為主題,於8月底在北京開幕。本屆大會共有27款人形機器人整機亮相,數量創歷屆之最。這些新品不僅在外觀上更加接近人類,而且在功能上也實作了重大突破。
2024年被認為是人形機器人產業化「元年」,人形機器人已經從早期的簡單模型發展到如今具有高度整合和智能化的階段。未來,人形機器人將憑借其效能優勢在工業、生活等各領域高速滲透,潛在市場空間達上百億美元。
根據Stratistics Market Research Consulting數據,預計2022-2030年全球人形機器人市場CAGR有望達到63%,其中國市場規模從2022年的2.5億美元增長至2030年的105億美元,CAGR為59.4%。
第一財經深度調研此次參會人形機器人本體廠商和核心零部件公司,進一步了解人形機器人的產業化行程和行業投資機會。
1、多場景落地套用,小規模量產在即
人形機器人產業正在從概念走向實用化,多場景落地套用正逐步成為現實。人形機器人的產業投資也從關註概念走向關註企業量產情況。除了B端商業及工業場景的套用,C端人形陪伴服務機器人也逐漸走向現實。
特斯拉計劃於明年開始小批次生產Optimus(擎天柱)人形機器人,預計工廠在明年部署超過一千個人形機器人協助人類工作。未來特斯拉的目標是每年生產1億台機器人,占據市場份額的10%以上。機器人的成本控制在大約1萬美元,預計售價為2萬美元。優必選人形機器人的工業版Walker S系列已經進入多家車廠,和東風柳汽、吉利汽車、一汽紅旗、一汽-大眾青島分公司、奧迪一汽等諸多汽車企業達成合作。該系列機器人今年年底會小批次交付,定價則主要取決於車廠的需求。智元機器人的雙足人形機器人遠征A2定位於互動服務和行銷場景,可以進行多模態的人機互動;面向工業場景的輪式人形機器人遠征A2-W,透過雙臂和夾爪的配合實作不同類別工業零部件的抓放。智元機器人表示今年兩款產品預計總發貨量300台左右。宇樹科技人形智能體Unitree G1的正選價為9.9萬,並於今年世界機器人大會上推出了G1量產版本;通用人形機器人p於去年世界機器人大會期間正選,目前已叠代多個版本,亦實作了批次量產和發貨。銀河通用的第一代人形機器人蓋博特(Galbot)可以完成物品上架和取貨任務。在商用服務領域,該公司正在與美團合作打造24h無人值守藥店,由機器人完成盤點補貨、取貨清理等工作,預期今年落地。銀河通用今年將完成第一代產品的小批次交付,售價約為40萬-50萬,明年完成更多場景拓展後逐步實作大規模量產。UniX AI(優理奇科技)研發的Wanda輪式雙臂人形機器人定位於家庭商業服務,已經完成洗衣、疊衣、做早餐等單點場景的成熟套用,預計今年實作大約100台小規模量產。 在B端尤其是工業場景的套用,特斯拉、優必選等企業的人形機器人在大模型技術的加持下已經實作在智能生產線的套用落地;而C端場景的套用上,由於家務場景多達一千多項任務,目前家庭服務人形機器人能夠實作的任務尚不足十分之一,走進千家萬戶仍需要時間。但家庭陪伴人形機器人有望在年內落地。優必選此前就預計,在2024年年底、2025年年初,會推出一款家庭陪伴功能的人形機器人。
需要註意的是,投資人在關註各大廠商小規模量產情況的同時,需格外註意各大廠商交付後在實際套用場景的效能情況。某頭部機器人廠商表示,大規模量產在技術上並沒有太大難度,主要難度是下遊對產品的需求度,而這取決於目前小規模試點套用的情況。
2、「大腦+小腦」,大模型實作具身智能
2024年,人形機器人行業在具身智能領域取得了顯著的突破,基於通用大模型、數據集、高效計算架構、多模態融合感知等關鍵技術,為人形機器人安上聰明的「大腦」,使得人形機器人具備認知和決策能力,推動人形機器人走向實用階段。
國內人形機器人廠商主要采用分層端到端的方案,即透過「大腦大模型」和「小腦大模型」互相配合完成任務。「大腦大模型」大多基於多模態通用大模型,完成對任務的感知規劃,再透過API排程「小腦大模型」驅動關節硬件完成執行。
例如優必選人形機器人Walker S接入百度文心大模型;智元機器人與科大訊飛簽署合作戰略協定,依托訊飛星火大模型進行聯合開發;樂聚機器人誇父搭載的是華為盤古大模型。
在「小腦大模型」方面:
在技能套用上,銀河通用自研了全球首個開放指令六自由度取放大模型系統Open6DOR、世界首個多模態具身導航大模型NaVid,研發了能反思、可隨機應變的操作大模型系統SAGE,在大小腦模型的聯動下,蓋博特已可以理解人類自然語言並根據語言指令與人類互動。智元機器人推出了通用的位姿估計模型 UniPose、通用的抓取模型 UniGrasp,通用的力控插拔模型 UniPlug 等一系列通用原子能力模型,可以配合大語言模型框架去做任務編排,使得機器人相比傳統協作機器人更容易部署,且具備一定的泛化能力。優必選則從套用場景出發,集合了工業場景垂域大模型技術、電腦視覺感知、語意VSLAM導航、學習型全身運動控制、多模態人機互動等人形機器人全棧式技術,將人形機器人引入汽車產線的智能搬運、質素檢查和化學品操作等工位,推動人形機器人在汽車工廠的大規模套用。 值得註意的是,特斯拉Optimus使用完全端到端的神經網絡大模型,借助傳感器和電腦視覺技術,利用海量數據不斷最佳化訓練過程,直接生成關節控制序列。按照智元機器人此前定義的G1至G5的具身智能技術演進路線,特斯拉目前進入G4階段,國內大多人形機器人廠商目前仍在G3階段。
在「小腦」操作大模型領域,各大廠商剛剛起步,多技術路徑同步發展。操作大模型決定了人形機器人在任務執行側的準確度,是大規模商業套用場景落地的前提,需關註各大廠商「小腦大模型」技術進展及落地套用情況。
3、具身智能訓練數據仍較為短缺
由於訓練機器人所需的物理數據不如文本數據量大且易獲得,相較於圖文大模型千億規模的數據訓練量,目前機器人數據集量遠不能滿足機器人達到通用大模型的需求。目前解決人形機器人訓練數據短缺的問題,一方面透過強化學習演算法提高模型訓練效率,一方面則透過仿真平台合成數據,建立數據開放生態。
銀河通用自研合成了千萬級的場景數據以及十億級的抓取數據,在合成數據的訓練下,其蓋博特人形機器人目前已實作抓取隨機放置的透明、高光等物體成功率在95%以上,進一步掌握類似開櫃子、開抽屜、晾衣服等靈巧手泛化操作技能。
智元機器人構建了一套完整、全流程的數據采集、套用的方案AIDEA,包含AIDEA ML機器學習平台和AIDEA Sim仿真平台。預計智元會有百台以上自由部署機器人專門用來做端到端的數據采集,也將於四季度開源基於AIDEA的百萬條真機、千萬條仿真數據集,以積極建設開放生態。
各地人形機器人創新中心也在積極建設人形機器人訓練場。上海人形機器人制造業創新中心孵化的「開源道場「MiniGym」,2024 年計劃上海打造100個人形訓練場,2027 年計劃在各個城市、各個場景打造 1000 個訓練場,100台采集器材,構建 1PB 數據集(每周生產 5TB+)。北京創新中心自主研發的通用人形機器人母平台「天工」的訓練基本都是在虛擬的世界完成的。
數據對於訓練人形機器人具有至關重要的作用,它直接影響到機器人的感知能力、思考和決策能力以及行動執行能力。大模型透過大量數據學習,讓機器人理解任務意圖,並遷移到下遊任務中,高質素訓練數據能夠有效提升人形機器人場景泛化能力。除了關註各大廠商訓練數據獲取方式,同時也可以關註與各大人形機器人創新中心合作生態共建情況。
4、觸覺感知是人形機器人精準控制的關鍵
人形機器人的視覺和聽覺在深度學習演算法以及人工智能的支持,已經發展較為完善,但在觸覺方向上的技術進展要落後於視覺及聽覺,觸覺傳感器為人形機器人提供了與環境進行物理互動的能力,是實作高級機器人功能和套用的關鍵技術之一。
觸覺傳感器使機器人能夠透過接觸來感知周圍環境,從而實作更精細和復雜的互動。同時借助觸覺傳感器,人形機器人能夠進行精確的操作,如抓取易碎或形狀不規則的物體,實作平穩且準確的握持,同時可以幫助機器人感知施加在物體上的力,這對於手術或精密裝配等需要精確控制力度的場景中至關重要。
由於觸覺涉及物理量過多難以解耦,觸覺傳感器研發難度大、精度提升困難,成為人形機器人急需突破的關鍵技術之一。
觸覺傳感器企業帕西尼感知科技稱,該公司的核心產品已套用於國內外頭部機器人企業,且在多維觸覺傳感器領域保持出貨量、市占率領先。該公司在今年世界機器人大會上展示了其標桿性的第二代多維觸覺人形機器人TORA-ONE,還推出了第二代多維觸覺靈巧手Dexp3以及多維度觸覺傳感器PX-6AX GEN2。
作為人形機器人精準控制的關鍵,觸覺感知的相關發展與套用將進一步推動人形機器人商業化走深走實。目前國內柔性觸覺傳感器仍處於產業化早期階段,受益於人形機器人的需求驅動,有望加速國產廠商技術更叠和市場空間提升。
(本文來自第一財經)