當前位置: 華文世界 > 科技

大模型添火,但「打工仔」機器人尚處孕育期

2024-08-25科技
2020年之前,有投資人詢問宇樹科技創始人王興興做不做人形機器人,後者斬釘截鐵表示不做。但在2023年年初,宇樹科技步入人形機器人賽道,轉變的核心原因在王興興看來,主要是2022年前後,在特斯拉創始人埃隆·馬斯克(Elon Musk)帶領下,全球科技對人形機器人非常關註。伴隨2022年年底大語言模型面世,AI技術發生質變,行業看到了AI賦能機器人帶來的潛力。
在大模型趨勢加持下,2024年世界機器人大會熱度進入歷年高點,現場展示出27款機器人,透過與多位行業人士對談,第一財經記者發現,目前機器人行業共識在於清楚賽道尚處於非常早期的階段,大模型與機器人結合是大勢所趨。而非共識在於機器人技術路線、人形與非人形具體形態、商業化落地方向等不同維度尚有分歧。
星海圖創始人高繼揚對記者表示,機器人行業處在早期孕育階段,從業者對技術路徑判斷仍有分歧,新公司仍在不斷湧現,技術路徑尚未完成收斂,商業化周期更長,種種因素使得今年上半年的機器人賽道更像是春秋時期。下半年或明年,頭部玩家將逐漸浮出水面,聚攏更多人才與資金。
機器人產品「百花齊放」
21日至25日的世界機器人大會現場,多款機器人新品相繼亮相。北京具身智慧機器人創新中心自主研發的「天工」實作全球第一個全尺寸純電驅人形機器人的擬人奔跑後再亮新技能,全球首款搭載人工智慧深度學習技術的骨科手術機器人首次釋出,軟體機器人突破工業套用領域瓶頸。
以「天工」為例,今年4月剛面世時,該機器人憑借出場時6km/h的穩定小跑,實作全球首例純電驅全尺寸人形機器人的擬人奔跑。四個月後,「天工」再次升級,基於狀態記憶的預測型強化模仿學習方法,在具身智慧大模型的加持下,掌握了語音互動抓取能力。當人下達語音指令後,具身智慧機器人就能基於「開放詞匯目標檢測與任意物品分割多模態模型」完成一套抓和放的動作。
優必選科技副總裁郝寶玉表示,公司結合端到端模仿學習、視覺精準辨識、全身精細運動控制等技術,工業版人形機器人Walker S Lite已「入職」多家汽車工廠,如在極氪工廠的CTU入庫上料工位協同員工執行搬運任務。
剛剛釋出人形機器人T230新品的鈦虎機器人創始人易港稱,T230是國內第一個高達2.3公尺的人形機器人,主要套用於重物搬運場景。依托自主研發的輕量化減速器等核心部件,實作了機器人身體輕卻力量大的特點,力量相當於正常成年人的三倍。
機器人行業實際已有數十年的發展歷史,在藍馳創投合夥人曹巍看來,中國市場是一個潛在的巨大的機器人市場,不管是從機器人消費還是機器人出口視角,中國在全球領域都是巨大的支柱型市場。另外,中國存在人口老齡化問題,未來機器人是有可能且最有可能解決中國未來人口老齡化、勞動力供給的關鍵技術節點。同時,在人才供給和社群生態方面,中國也有著非常好的人才土壤,國內有400多所大學設定了機器人專業,過去五年已有超過10萬家機器人企業在註冊,每年平均有1萬至2萬家。
資本方面,過去十年整個投資界不管是美元還是人民幣基金,投入機器人領域的總額過千億。各地方政府與引導基金也都在積極設立與機器人相關的產業大基金,扶植和推動機器人產業發展。加上產業集群和長期政策支持,曹巍判斷,在未來5-10年,甚至15-20年,機器人賽道都會是一個重要且支柱型的基礎創新賽道。
行業邏輯之外,今年機器人賽道之所以爆火,多位行業人士對記者表示,影響因素中最大的就是以大模型為代表的AI技術升級叠代。采訪中王興興表示,目前這一波機器人浪潮,最大影響因素就是AI浪潮。目前大家更加相信AI,更加相信人形機器人可以誕生更多價值,這在十年前是完全不能想象的。
曹巍持有同樣觀點,他稱,大模型令行業看到機器人在復雜任務的串聯和執行上有了大幅提升。機器人傳統演算法過去成功率在50%左右,即實驗室初級水平。但有了大模型的加持,同樣的演算法結合大模型之後,成功率提高了50%以上,有的甚至是提高了100%,已經慢慢接近商用水平。
審慎看待技術熱度
大模型技術並非萬能,遑論技術本身尚未完全成熟。
王興興對記者表示,真正解放AI能力還需要物理機器人能真正幹活。「幹活」這件事是行業對機器人的首要期待,這也帶來行業對機器人想象空間的提升。也正因此,王興興認為當下技術對機器人行業最大的一個限制,是AI「不太夠」——AI模型、AI訓練數據集、AI場景的落地部署,都遠遠不夠。
雖然硬體層面也未完全成熟,但硬體目前已經不存在理論門檻,主要存在工程化問題,也就是要讓機器人在工程上將成本做得更低、更好,外觀做得更極致,硬體功能做得更豐富,但這些問題在時間上都是可以預估的。相較而言,機器人AI技術尚未突破這件事更具挑戰。
據曹巍多年行業觀察,機器人本體不管是運動控制,還是末端執行的精細化操作,都有了長足的進步。逐漸從Model base的演算法走向Learning base演算法,這個趨勢也讓行業看到未來機器人的成長空間可以與數據結合,數據越多、學習表現越好。
但需註意的是,曹巍表示,機器人由上千個零部件構成的,機器人本體也是很重要的一部份。過去2-3年機器人人形初步硬體架構已經確立,但是它的關鍵模組、技術路徑還在不斷的叠代和探索。
不同於行業普遍認為大語言模型是機器人賽道核心變量,星海圖創始人高繼揚認為具身智慧真正要解決的是機器人在物理世界執行的能力。未來阻礙智慧型機器人大規模融入人類社會的關鍵瓶頸是智慧系統,而非機電系統,其中的關鍵因素在計算能力和傳感器系統,以及演算法本身。
在多元技術路徑中,行業對技術安全性與穩定性的要求愈加嚴格。歐洲機器人協會副主席Juha Röning在表示,從機械工程的角度看,機器人領域已經實作了高度標準化。但對現代系統和軟體架構而言,行業距離實作「隨插即用」的水平還有相當的距離。與機械工程相比,電腦科學領域的標準化程度較低,簡單地將功能性元件組合在一起是遠遠不夠的。在AI領域,這種標準化更是稀缺。
日本機器人學會主席Shigeki Sugano表示,行業將AI與硬體以及其他各類公共資訊相結合,創造出一種具備智慧能力的硬體實體,進而實作人機共生互聯。由於人始終是最終的服務物件,因此,安全性和高功率輸出成為亟待解決的關鍵問題。盡管市場上已有人形機器人,但大多數這類機器人無法有效支持人類活動,因為它們的功率輸出不足。如何在保證安全性的前提下實作高功率輸出,是Shigeki Sugano所認為的最核心議題。
分歧背後的存活方向
需要明確的是,機器人行業已有數十年的歷史,產業技術每年都在微觀處發生改變,總的趨勢是在向自動化邁進。
在IEEE工業電子學會主席(2000)、台灣大學何宜慈講座教授Ren C.Luo看來,二三十年前的機器人1.0時代有一些電機、控制器;2.0時代加入視覺檢測,加入變得更加智慧;3.0時代出現了人形機器人和協作機器人;現在行業進入4.0的智慧時代。
當下的機器人行業在王興興看來,每家的想法都不太一樣,比如機器人的相機應該裝什麽?裝在什麽地方?相機應該裝幾個?傳感器數據應該怎麽采?要不要安裝觸覺傳感器?觸覺又是一個寬泛的話題,有些流派不想使用超觸覺傳感器、數據傳感器,甚至國外有些流派連靈巧手都不想安裝,只想用個爪子替代即可。有些流派希望手更加靈活,也就是手指要更多,而每個手指上都要按照足夠豐富的傳感器。
因此總結來看,王興興稱,行業內每個人的想法都不太一樣,目前整個的AI模型的技術路線也沒有那麽統一,這就導致了很難定性哪條技術路線是正確的,哪條路線是錯誤的,哪個路線已經推進到哪個節奏了,這些都是無定論的難題。
如果類比大模型,王興興表示,大語言模型出現後,大家已經忘記GPT之前的其他模型了,但實際在大語言模型這個圈子裏,ChatGPT出現之前,行業內有非常多語言模型結構。但GPT模型證明自身架構價值後,其他架構也被隨之淘汰。而目前的人形機器人與具身智慧賽道有些像ChatGPT出現前的一兩年,行業有意識向某個方向發力,但沒有哪一家敢保證,這個方向絕對正確。
借助大模型熱度,熱錢湧入機器人行業。據第三方數據統計,今年截至2024年6月30日,國內機器人行業融資69起,已披露金額融資事件中億元級融資12起,機器人領域已披露融資總額總計約75億元。融資額較高的案例如宇樹科技近10億元B2輪融資,銀河通用7億元天使輪融資等,此外還有智元機器人、星動紀元、星海圖、帕西尼感知、星塵智慧等明星初創公司。
高盛研究分析師、中國工業技術研究主管Jacqueline Du此前預測:到2035年,全球人形機器人市場總額將達380億美元,較之前預測的60億美元增長了六倍多。
曹巍對記者表示,具身智慧領域技術在過去一兩年內大幅提升,其中必然存在泡沫情況,但好的公司理應「享受」泡沫,從中實作真正價值的創造。熱度之下,價值判斷應依據創業公司團隊本身:團隊在技術落地與產品化過程中的能力是否足夠強,團隊是否想過真正的商業化落地路徑。「如果有能力在一年內造出1000台機器人,兩年後造出一萬台機器,這就是在做事業。」曹巍表示。
而機器人的落地是循序漸進的過程,曹巍表示,在B端市場,企業對機器人的需求主要集中在明確的成本效益和穩定性上,企業希望機器人能夠在特定場景下完成簡單但高效的任務。同時C端市場也面臨著新的挑戰。隨著消費電子產品的普及,許多標準化的任務已經被成熟產品所替代,留給機器人創業公司的基本都是復雜任務,如家庭清潔、照顧老人等非標準化任務,這些任務不僅涉及空間互動,還需要機器人與其他智慧體的協作。
身處行業早期,曹巍給到初創公司的建議仍舊是「廣積糧」,在行業尚未形成成熟商業化的情況下,先想辦法多融錢、儲備資金。其次是提升商業化能力。「行情好的時候多拿錢,拿不到錢的時候想清楚自己怎麽賺錢。」
(本文來自第一財經)