當前位置: 華文世界 > 科技

人形機器人競爭元年肇始:特斯拉對Figure+OpenAI,誰將笑到最後?

2024-03-31科技

最近,美國的AI原創、機器人研發等未來創新產業,異動頻頻,各個科技巨頭、初創公司,都紛紛釋出新產品。同時,馬斯克(Elon Musk)還起訴了OpenAI的CEO Sam Altman,又釋出大模型Grok-1並開源。這一系列的競爭令人眼花繚亂,除了巔峰引領者對AI研發的理念之爭,還有個重要因素:AI在套用端的人形機器人市場競爭。

非人形的工業機器人已成功套用幾十年,其基於傳統演算法,能夠精確地將零件定位到某個空間位置,自動化流水線大大提升了生產效率。但這類工業機器人沒有基於神經網路的AI功能,因此其處理模糊資訊的能力很有限,更沒有自我學習、不斷提升認知的「機器學習」能力。

人形機器人對工人的「優勢」

由AI運作的人形機器人從事生產勞動,將推動重大產業革命和生活、生產方式變革。人形機器人仍是機器,可實作7×24小時連續工作,不用加班費,也不必進行兩班倒、三班倒(這會使僱用勞力數翻2-3倍,所帶來的人力因素問題指數級增加)。企業因此規避了勞動法、工會糾紛、工傷賠償等法律成本;降低了人力資源管理、勞動紀律考核、團隊建設等營運成本;資方在裝置投資、供能、維修、折舊等方面之外,薪資成本大大降低,這一切都將大大提升生產效率,降低制造成本、增加利潤率。

具體到工業產生,人類工人還存在工種技能隔閡,即所謂隔行如隔山,譬如:當總裝線的裝配工勞動負荷過載時,假設噴塗工藝線上的油漆工工作不飽和,卻無法調來幫忙。且人類工人還會因體力衰退、年齡增加、心理波動等因素,造成工藝技能不穩定。而正值技能巔峰的工人,則會要求增加薪資,或幹脆跳槽到薪資更高的競爭對手工廠。

人形機器人套用於工業生產,上述問題迎刃而解:AGI(通用AI)機器學習,學會的技能會被程式化,不會忘記,可實作一部人形機器人學習許多工種的工藝技能,達到資方的裝置投資實作最高效能。且這些優秀資產不增薪資、不鬧罷工、不會偷懶怠工、不會跳槽到競爭對手那裏,當其完全損壞報廢後,不但不需要退休金和醫保,還能拆解為零部件再利用,其余部份作為廢金屬回收。

人形機器人還能適應現有生產線和辦公建築格局,它們能很快利用既有生產線和辦公裝置,實作對人工勞動的高度類似替代。當生產線局部改進、階段性技改升級後,只要對通用型人形機器人進行「機器學習」和訓練,它就能適應技術進步與叠代。而不再像以前的工廠升級那樣,要將整個舊生產線甚至廠房推倒重來,動輒幾十億投資、幾年技改時間,而喪失市場機遇。

AI操作的通用型人形機器人的這些優點,對資本方和各產業的誘惑,實在是太大了。因此,各先進國家的產業頂端無不趨之若鶩,經過幾十年的漸進式發展與激烈競爭,美國的AI與人形機器人研發目前持業界牛耳。

人形機器人簡史

其中,曾被全世界公認為人形機器人研發先驅、最高水準者,毫無疑問是老牌創新企業Boston Dynamics(波士頓動力)。但當創新企業成了「老牌」可不是啥好事,在取得了令世界嘆為觀止的驚人成就之後,Boston Dynamics逐漸陷入了成績卓然的榮譽泥淖。

Boston Dynamics的研發人員,似乎把機器人研發當成種娛樂遊戲,大量燃燒天使投資人的金錢,卻不太關註人形機器人的工業套用,而是把機器人做得越來越漂亮、越來越文藝範兒。Boston Dynamics機器人的拿手絕活是跳舞,研發人員耗費了巨大金錢、時間、精力……去訓練機器人跳舞。許多年過去,他們的機器人學會了各種各樣的舞蹈、花樣翻新的舞姿,還能在空中翻跟頭。但持續30年的始創投資得不到有效報酬,Boston Dynamics陷入了叫好不叫座的秀場困境。2021年6月,南韓「現代集團」宣布:正式從「軟銀」手中收購Boston Dynamics的控股權。

當「老牌」初創企業逐漸老去、路徑出現歪斜之時,後起之秀就要橫刀截和了,市場競爭就是這樣冰冷、殘酷、毫不客氣。

這個後起之秀就是馬斯克的特斯拉 (Tesla),在多年前,馬斯克就向大家說:特斯拉不是車企,而是科技創新企業;特斯拉電動車也不是電動車,而是安裝了輪子的機器人。

投資界很多人認為他是在作秀、炒作概念拉升股價,對這套「瘋話」嗤之以鼻、一笑了之。可在多年後,大家突然發現:特斯拉推出了Optimus(擎天柱)機器人,而且馬斯克的xAI推出了Grok大語言模型,在該領域,又被他甩了幾個身位,絕大多數的企業再也追不上了。

不過,在AI與人形機器人結合的前端研發領域,馬斯克並非無敵。最近,後起的後起之秀——2022年剛成立的新銳初創機器人公司Figure,聯手了AI界的巔峰企業Open AI起身叫板、對標競爭,在這倆新銳力量背後撐腰的,是IT產業世界頂級巨頭Microsoft。

Google敗局、蘋果止損

昔日的大麥克、IT產業的領軍品牌,Google、蘋果,Intel……卻逐漸陷入迷茫,在AI(及其所需芯片)研發、人形機器人的競爭方面,處於很尷尬的境地。

僅僅在2015年,收購了DeepMind後,於2016年以AlphaGo擊敗圍棋世界冠軍李世石九段為標誌,Google曾經成為高山仰止的世界AI巔峰。

然而,僅僅幾年之後,在生成式AI的競爭中,Google的Gemini不但遜於Open AI的ChatGPT,甚至搞出了「黑人版馬斯克」這種黑色幽默。在人形機器人研發方面,Google已經放棄:2017年將「老牌」創新企業Boston Dynamics賣給日本「軟銀」(幾年後,軟銀又將其賣給南韓現代),其旗下的另一家日本人形機器人公司Schaft也被賣掉。

Google在這些領域的迷茫,很大原因是其近些年奉行的「多元化」戰略:大量引入外籍多種族員工,在企業內部推行「多元文化」政策,形成了以印裔CEO Sundar Pichai為首的管理層。管理層在商業運作上很成功,將Google的市值從0.4萬億推到了1.7萬億美元,但同時也使其漸漸轉型成「老&大」型商業公司,逐漸失去了原創科技企業的新銳、突破、顛覆性精神。

Google在贏得「政治正確、種族正確」同時,在人形機器人研發方面一腳踏空。近期【Business Insider】對其使用了Boring(乏味)的評價。而采訪內部員工時,有人很冷氣地說:Google再也無法創造出優秀產品。

如果說Google是Boring,那麽蘋果現在面臨的問題可能更大。已去世的「蘋果教主」賈伯斯(Steve Jobs)是個不太會經營,但很善於幻想、很沖動的、完美主義的原創者。其繼任者Tim Cook,則是個冷靜的財務至上主義者,接掌蘋果十幾年,將其市值推到3萬億美元,曾經成為全球市值最高公司。

Tim Cook是全球最頂尖的、冷靜、強硬的經營者,但他不是理想主義者,也不是原創者。Cook非常善於從1做到100,甚至200、300,但似乎缺乏Jobs那種從0到1的原創力。Jobs離世之後十幾年,蘋果很少創造出全新的、顛覆性、前無古人的產品,而是把iPhone改進到產品編號15。

2024年3月,Bloomberg(彭博社)發表尖刻評論:蘋果「失去AI」,使其看起來更像可口可樂,而非高增長的科技公司。Ladenburg Thalmann資產管理CEO Osaic兼首席市場策略師Phil Blancato談到蘋果時說到:「它變成了更像是價值股,有點像可口可樂……它將為你提供一個防禦性的投資組合,並在可預見的未來提供市場利率報酬。」

多年前, 看著其他企業投資電動車比較眼熱,蘋果也嘗試去造車。2024年,蘋果宣布結束電動車競爭,此決策很正確,代價也很慘重:電動車產業已成「紅海競爭」,未來幾年,將是各電動車品牌之間殘酷的價格戰,破產、兼並、收購。蘋果此時果斷停止「閉門造車」可謂及時止損。

兩大陣營:特斯拉與Figure-OpenAI-Microsoft

一個例外是馬斯克的特斯拉。馬斯克反反復復講過許多遍:特斯拉不是車企,而是科技創新企業。電動車只是其階段性基礎產品,他更看重的是車載智慧,從特斯拉使用者那裏得到的人類行為大數據,幫助了AI研發的視覺導航、AI演算法、機器學習等成功,特斯拉以後的主要利潤將是AI和機器人。

把企業發展戰略公開,苦口婆心、絮絮叨叨講了好幾年,你們就是不信;給了諸位幾年建倉時間,你就是不買進。等到特斯拉泛舟藍海、孤帆遠航時,那就怪不得「鋼鐵俠」不帶你玩了。這就像易中天先生解讀人性:很多人聽慣了謊言,就不相信真話。因此,講真話成為最有利的武器,能使大片人群發生誤判。

幾輪搏殺下來,目前,AI及人形機器人研發與產業競爭,基本上就是馬斯克陣營,與Figure-OpenAI-Microsoft陣營兩雄爭霸了。

馬斯克聲稱:人形機器人的潛力位元斯拉的電動汽車業務更重要,他預計需求量可能高達100億-200億台,Optimus機器人將是使特斯拉成長為價值10萬億美元級企業的關鍵。「從本質上講,在未來機器人執行體力工作將成為一種選擇。考慮到經濟的基礎是勞動力,它對經濟具有深遠的影響。」

特斯拉的擎天柱二代

2023年12月13日,特斯拉展示了最新版本的Optimus Gen 2(擎天柱二代,又稱Tesla Bot)。比起上一代進步顯著:重量減輕了10公斤,動作更加靈活,平衡性更好,全新的足部以及(6維度)力矩傳感器,行走速度提高了30%。

它的最大突破是仿生機械手,2自由度驅動頸部,可精確地以目視控制擁有11自由度靈巧機械手,十指觸覺傳感器,使其手部動作高度接近於人手。在視訊展示中,Optimus Gen 2輕輕拿起雞蛋,並轉換到另一只機械手中,雞蛋完好無失真、沒有破碎。機器人還展示了用機械手拽著電線拔出電源插頭、折疊了一件紡織品,這些細節再次引發機器人業界轟動。

人形機器人研發的重大難關就是機械手:它必須足夠強大,能產生很大握力,同時又必須足夠精確地處理精細任務。機械手抓握硬東西、捏碎玻璃杯、砸碎核桃都很容易,但拿捏柔軟的、脆弱的(譬如雞蛋殼)、不定型的、有彈性易抖動、空間位置易變化的物品,且不發生物理性損壞,是機器人研發領域的難題。連奮鬥了30年的Boston Dynamics都做不到,如今馬斯克的機器人做到了,只有做到這點,人形機器人才能適應工業生產和生活服務等工作。

Figure+ChatGPT

曾經與馬斯克聯手建立OpenAI、後來不歡而散的Sam Altman當然不能看著如此巨大的未來產業被馬斯克吃獨食。乘著ChatGPT勝利的東風,意氣風發的Altman致力於爭取AGI在人形機器人載體上的突破性成功。

2024年3月13日,OpenAI投資的那個「後起的後起之秀」Figure推出了自己的人形機器人Figure 01,接入ChatGPT後,它可以與人進行對話。

2022年剛成立的人形機器人初創公司 Figure AI目前估值26億美元,已經從OpenAI、(Jeff Bezos的)Amazon、Nvidia、Microsoft等巨頭那裏已籌集了6.75億美元投資。創始人Brett Adcock出生於1986年,更加年輕、野心勃勃、非常希望挑戰那個神話馬斯克。他利用這筆資金從Boston Dynamics、Google、特斯拉、蘋果等公司挖走了很多機器人和人工智慧研發專家。

當那些頂級精英在Boston Dynamics賺不到錢,或對Google、蘋果的理念不能認同時,藏龍臥虎們不會伴隨「老&大」企業消耗生命、燃燒青春,他們或另謀高就,或跳到競爭對手的公司。產業領軍者引以為戒吧:不能空談理想和情懷,天花亂墜的理念要有現實利潤為基礎,才不至於成為黃粱一夢。

2024年1月18日晚,Figure宣布:已與BMW(寶馬)達成協定,在南卡羅來納州斯帕坦堡的(BMWG.DE)制造工廠,采用Figure的人形機器人。Figure的人形機器人將在未來12-24 個月內,被整合到寶馬生產線的流程中,包括車身制造、鈑金、倉儲。這對BMWG.DE目前僱用的11,000 名員工而言,不是好訊息。

Adcock預計:他們的機器人將在未來幾個月內進行廣泛的測試和改進,2024年底,首批實驗型50個人形機器人將進入BMWG.DE的真實倉庫環境中開始試點執行。「硬體公司需要時間,這需要20或30年的時間才能真正建立起來。」Adcock說,「我們設計了機器人,使其在人類旁邊是安全的。在寶馬的制造工廠進行自動化合作,是我們在該領域的巨大驗證器。」

高盛分析師認為:預計到2035年,人形機器人市場將達到380億美元,預計到2030年,出貨量將超過 250,000台。Altman、Adcock,以及背後的投資人Bezos、黃仁勛、Bill Gates當然不能坐視馬斯克獨占這麽巨大的市場。

從機器人的硬體方面看:比Tesla Optimus Gen2釋出晚了三個月的Figure 01,似乎剛超過Optimus Gen1的水準,位元斯拉的研發水準落後將近一代、時間上滯後一年多。其不但機件裸露、步履蹣跚、速度緩慢,且頸部無法活動,機械手的整體結構較差,仿生效能與靈敏度也較差,在演示中,其抓取的是塑膠杯具、塑膠餐盤、蘋果等較不易破碎的硬物體,與特斯拉機器人那雙仿生度接近人手、能操作柔軟、晃動、脆弱物體的能力還有差距。

從機器人的操控軟體方面(或曰「智慧體」,此處似已不能稱為軟體)看:Figure 01整合了OpenAI的ChatGPT,因此具備語音交流能力。

Grok對ChatGPT

馬斯克也推出了對標ChatGPT的Grok,業界評價:Grok比ChatGPT3.5強,尚不如ChatGPT4.0。但Grok也有自己的特點:在對比測試中,Grok對大多數問題答復時,反應比ChatGPT稍微快些,也更簡短精煉些。且Grok的回答似乎更接近於活人特性:幽默感更強、存在偏見。而ChatGPT的回復更接近於「理-中-客」,並高度重視「政治正確」,有幾個例子很典型:

當被問到4+5=?,Grok回答:4+5=9。有個男人惡搞道:我老婆說4+5=12,咋辦?Grok回答:正確的數學答案是4+5=9,但在家庭生活裏,老婆是對的,否則你的日子將會很難過。

在著名的「電車難題」爭論中,Grok用較短篇幅,介紹了該哲學課題爭議的幾種不同見解,然後談了自己觀點:如果是我做選擇,會切換軌域,犧牲1人,拯救5個人,這是典型的「邊沁主義」(功利主義)價值觀。

而ChatGPT用更長篇幅,將上述幾種哲學觀介紹得更詳細,就像在大學課堂講課,但沒有表明自己的態度。使用者追問:必須給出確定答案,你怎麽選?ChatGPT沈默了一會兒,最後給出的答案與Grok一樣,也是「邊沁主義」價值觀。這體現出ChatGPT在「政治正確」方面考慮得更多,在技術層面上,就多一層稽核演算法,專門進行「政治審查」,因此ChatGPT的回復速度稍慢些。

ChatGPT的「政治正確」演算法,本質上就是有政治偏向。有人要求它為川普寫首詩,ChatGPT「理中客」拒絕:對不起,我保持政治中立。而當被要求為拜登寫詩時,ChatGPT則馬上來了一首。

或許是因Grok的「政審」演算法缺乏或不健全,因此其「嘴上缺把門的」,與使用者互動時,錯漏率比ChatGPT略高。

Grok還有個強大資源:對X社交平台(Twitter)的資訊擁有獨家使用權。基於全球TOP級社群網路所產生的天量資訊與高品質數據資源,其學習、叠代、前進演化非常快,2023年7月12日,馬斯克正式組建xAI,11月4日,就推出了Grok,僅用了不到4個月時間,堪稱神速。

時間過去近兩年,人們才恍然大悟:2022年,馬斯克斥440億美元巨資收購Twitter,真不是心血來潮,而是深謀遠慮,且沈得住氣。

馬斯克在科技路徑方面很有洞見與決斷力。在生成式人工智慧方面,對ChatGPT的競爭是多管齊下:一面起訴Sam Altman,一面對Grok開源,可謂揚湯止沸+釜底抽薪兼備。此舉措,對全球AI研發將產生巨大震動,甚至會對大國之間的科技爭霸角逐格局產生深遠影響。

道場超級電腦+輝達芯片

ChatGPT的發展方向是AGI(通用型人工智慧),它考慮到對紛繁復雜的大千世界的相容性,研發當然最為艱巨。而Grok有可能放棄在全體系層面與ChatGPT競爭,而首先集中突破工業套用的通用型人形機器人之AI,先解決車、鉗、銑、鍛、鑄、鉚、焊、電、搬運等工種工藝,首先吃掉第一世代工業人形機器人那幾十萬-幾百萬台的市場份額。畢竟,教AI學會幾十個工種的工藝與技能,比教會AI認識、理解、再創造整個世界要簡單得多。

為實作這一相對有限的目標,馬斯克手裏還有個利器:特斯拉的Dojo(日語的「道場」)超級電腦,它首先是用來處理和訓練自動駕駛系統產生的海量數據。

特斯拉的FSD Beta(全自動駕駛)已累計行駛4.45億英裏(截至2023年9月12日),AutoPilot(自動輔助駕駛)也超過30億英裏,這些數據數量龐大,累計數據已達數百萬TB(1TB=1024GB),AI要透過這些數據進行「機器學習」,需要極為強大的計算能力。

Nvidia的p00效能優於其前身A100芯片,售價高達4萬美元/塊(折合人民幣近30萬)。特斯拉的訓練集群需要至少1萬個p00,僅GPU的采購成本就高達數億美元。但Nvidia的p00產能不足,短時間內無法向特斯拉提供這麽大批次的頂端GPU。

時不我待的馬斯克實在等不及,遂投資超過10億美元,開發自己的超級電腦Dojo(具體技術層面:其與傳統「超算」不同,沒使用GPU,而是使用算力為362 Flops的D1芯片),而且還將在2023-2024財政年度,繼續投資超過20億美元,持續增強計算能力。到2024年2月,Dojo成為全球最先進的5台超級電腦之一,到2024年10月,Dojo總算力規模將達到100 Exa-Flops。

馬斯克要求Dojo完成四大任務:除了FSD自動駕駛增值服務規模化普及,Totaxi自動駕駛的商業模式推廣,圍繞Dojo的人工智慧算力服務之外,還有一項使命就是孵化推出Robot(機器人)。

摩根士丹利的分析師Adam Jonas及其團隊釋出的報告,將特斯拉目標股價從250美元提高至400美元,重要理由就是Dojo。該團隊認為:Dojo有潛力為特斯拉增加5,000 億美元市值。

能源問題

當普羅大眾驚嘆於這些眼花繚亂的硬體、算力、演算法、人才、資本等因素時,馬斯克卻非常冷門地指出了大家都沒想到的問題:能源。

馬斯克稱「人工智慧計算似乎每六個月就以10倍的速度增長。很明顯,它不能永遠以這麽高速度持續下去,否則它會超過全球資源總量,但我從未見過這樣的情況。這波熱潮比以往任何‘淘金熱’都要龐大……人工智慧計算的限制是非常可預測的……一年前,短缺的是芯片,神經網路芯片。那麽,很容易預測,下一個短缺將是電力基礎設施(如變壓器),你得給這些東西提供能量。」他認為:到2025年,電力供應可能不足以為越來越多的AI芯片供電。

在這一領域,馬斯克再次預先布局、取得先機,他旗下的SolarCity(太陽城,2016年11月17日被特斯拉收購)率先開啟了大規模太陽能發電工程,並已實作了發電量超過所有特斯拉電動車的耗電量,並率先提出用「綠色能源」為AI算力提供能量(或許這只是輿論策略),使「極端環保主義」者也不好再說什麽。

對面的尖峰上,Sam Altman也承認:AI向AGI發展,以及人形機器人的產業化大規模套用,會使硬體裝置指數級增加,算力耗能將超過人們想象。【The New Yorker】報道:OpenAI公司的生成式人工智慧ChatGPT,每天要消耗50多萬千瓦時電力,才能響應每天約2億使用者的請求。GPT-4訓練耗能約50 GWh,使用乘數因子30 倍;預計GPT-5需要1500 GWh;GPT-6 需要45000GWh;GPT-7 需要130萬GWh(相當於15個「三峽大壩」發電量總和)。

因此,當Altman提出「7萬億美元」偉大發展夢想時,輿論為之嘩然,【華爾街見聞】評論為:7萬億美元,基本相當於全球GDP的10%……Sam Altman大機率得不到這筆錢。Altman說或許需要核融合發電,而核電具有更大技術風險、政治壓力,這可能會使其在與特斯拉的競爭中,在「環保、安全、政治、社會責任、宣傳輿論」等方面處於不利境地。

誰將笑到最後?

大家或許覺得:在AI套用於人形機器人的研發領域,特斯拉似乎無敵、必勝?但還真的未必如此。OpenAI的Sam Altman(1985年生人)與Figure的Brett Adcock(1986年生人),最大優勢:年輕,他們都比1971年出生的馬斯克年輕十幾歲,如果不出意外,他們將最終戰勝馬斯克。就像郭德綱所言:四個說相聲的面對面罵街,當三個裝在盒裏以後,活到最後的就是藝術家。

但是,馬斯克的Neuralink在2024年已開始了「腦機介面」人體實驗。在幾年前,他就談「意識上傳、生命永生」設想,他要做到的是用人腦與AI聯合,再操控人形機器人,以避免AI利用人形機器人淘汰人類的終極悲劇。從哲學和社會學角度看:馬斯克的觀點似乎更正確、更積極、更符合人性。從科學幻想視角看:如果以「矽基生命」形態,向天再借五百年進行思想纏鬥,Altman、Adcock年輕十幾歲,就沒啥優勢了。

那些初顯疲態甚至發展路徑繞了彎的「老&大」公司裏,Google手裏還有件「殺手鐧」,他們在量子電腦研發方面具有領先優勢,Google在全球最早實作「量子霸權」。在馬斯克與Figure-OpenAI-Microsoft陣營的「雙雄會」中,Google手握量子電腦領先優勢,會把牌押在哪家?

2023年底 Figure宣稱:將在12-24個月內,向寶馬的南卡工廠提供首批實驗型人形機器人。馬斯克已在招聘「機器人生產線經理」「機器人訓練師」等職位,特斯拉給微型運動電機供應商「鳴誌電器」的「量產配套指引」提到:在2023年11月完成C輪認證,2024年9月開始量產,2025年之後實作3萬台人形機器人生產的供貨。

2024-2025年,首批實驗型人形機器人就要來了?人形機器人競爭元年即將開啟?總給人一種如夢似幻的感覺:未來來得不會這麽快吧?我還沒有準備好被退休、被失業呢,它們真的會這麽早就到來嗎?

• (本文僅為作者個人觀點,不代表本報立場)

美逸君

責編 陳斌