來源:晚點LatePost
許多基礎問題還沒搞清楚的人形機器人行業,就要面臨激烈競爭。
文丨賀乾明 編輯丨程曼祺
我們下午 3 點見到彭誌輝時,他還沒吃當天的第一頓飯。一日一餐是彭誌輝的常年狀態,他覺得自己 「習慣了,不影響活著,吃飯比較浪費時間」。
2023 年 2 月,彭誌輝參與創辦智元機器人,任 CTO,致力於做出商業化的人形機器人。在這之前,他更為人熟知的身份是 「天才少年」 和 B 站 「百大 UP 主」。
彭誌輝 2017 年開始以 「稚暉君」 為網名釋出各種硬核 DIY 視訊,現在他的 B 站帳號有 250 多萬粉絲,同體量的 UP 主通常是團隊運作,而他是一個人兼職做。不少人覺得 「全棧工程師」 難以概括他的能力,稱他為 「溢棧工程師」。
智元機器人成立後,彭誌輝把一切重心放到了公司,他基本沒休過周末。B 站最後一次釋出自制視訊是 2023 年 4 月。
極致地投入,是因為他想成就更大的事業。「我們的願景是用智慧機器創造無限的生產力。」 彭誌輝說。
也因為人形機器人行業許多基礎問題尚未解決,就要面臨激烈競爭。去年至今,中國已出現不下 20 家人形機器人公司。想把機器人送進工廠的智元機器人,還要與 2016 年前後成立的上一波 「AI+ 機器人」 公司競爭,它們服務客戶更久、經驗更多;再往後,更大的威脅是對具身智慧蠢蠢欲動的車企,它們能調動的資源遠超一般創業公司,而且有自己的工廠,這是現成的場景。
智元機器人認為,獲勝機率最高的方法是 「高舉高打」,用一種營運大公司、操大盤的方式創業。
多數同行專心研究一款產品時,智元機器人用一年半做出兩代人形機器人,並在今年 8 月一次釋出了 5 款人形機器人,還給同行提供數據采集方案。今年初,智元機器人還釋出過一款商用清潔機器人。
智元機器人 8 月 18 日釋出的 5 款產品。
大部份人形機器人公司會先側重某個技術方向,有的主攻硬體,有的主攻軟體智慧系統。形態上,有的重點放在上半身的操作能力,有的優先做下半身的運動能力。
智元機器人則 「全都要」:他們做完整的人形機器人,也根據不同場景開發分支形態;他們自研關節電機等核心零部件,也研發 「靈巧手」,還自己開發多模態大模型,同時研究強化學習、模仿學習、視覺模型等當前具身智慧的主流技術。
今年 2 月,多數新公司仍在代工組裝機器人時,成立剛一年的智元機器人就開始建設上海臨港首期工廠,計劃年底投產。
「看不太懂」「不是常規的創業公司」,數位科技投資人如此評價,他們很少看到初創企業同時做這麽多產品,下註這麽多技術方向,如果管理和後續資金跟不上,很容易出問題。
彭誌輝說,他們不是有意要如此,而是行業特點使他們必須這麽做:「人形機器人的研發涉及硬體、軟體、演算法、供應制造等一大堆問題,系統工程極其重要。在技術實作上,有的是工程問題,有的還是科學問題。這個行業空間大、門檻高、變化快,人才、資金和商業成果最後都會向頭部集中,如果只是小打小鬧,很難保持領先。」
最多資本投票向智元機器人。成立一年半,這家公司已至少融資 15 億元人民幣,估值達 70 億元人民幣,投資方有高瓴、紅杉、高榕、藍馳、比亞迪、上汽、三花智控、臨港新片區等 20 多家機構。智元還在今年初的股東會上給部份投資機構頒了獎。
紀錄片導演竹內亮曾在拍攝彭誌輝時,驚訝他精通如此多的跨領域技能,問:「有沒有你不會的東西?」 彭誌輝說:「不會生孩子」。這次我們又問了這個問題,他說:「不會停止學習」。
彭誌輝擺在工位上的書,大都是【湯瑪斯微積分】【編譯原理】等教材,唯一的例外是【埃隆·馬斯克傳】。馬斯克是他的學習物件之一。
「在學校裏學習更多是自底向上,先打好基礎然後做上層套用,出了校園之後更多是自頂向下,以計畫導向,缺啥學啥。」 彭誌輝說。聊到時間管理方法,他說是 「作業系統中的搶占式排程」,動態調整任務優先級,允許打斷,但是任何時間都專註於當前的任務。
他不喜歡 「天才少年」 的稱呼,他覺得教科書中那些能改變人類發展行程的科學家才是天才。
相比過去用幾個月就能獨自完成的小型計畫,參與創辦一家公司開發成功的產品要難得多。他要從個人作戰走向帶團隊協作,做出來的東西不能只是酷,還要能賺錢。這是一場新的、更復雜的學習。
以下是【晚點】與彭誌輝的對話:
耐心地沖刺,留在牌桌上
【晚點】:回到起點,為什麽 2023 年決定創業?
彭誌輝:人形機器人本身不是新事物。我做人形(機器人)比較早,16 年還在學校時就創業做了原型機,那時 「具身智慧」 還沒出現,主要做本體(機器人硬體部份),還拿過 500 萬投資。
這兩年具身智慧跟人形機器人這麽火,並不是本體有了什麽黑科技,最主要的還是 AI、大模型的出現讓機器人可能在本體之外有更多套用價值。我在華為昇騰就做 AI 計算,這個趨勢看得比較清楚。這是我出來創業的一個原因。
【晚點】:如果你想在華為做,應該也會得到支持。為什麽選擇創業?
彭誌輝:風格問題。華為在技術方面主要是搞基建,比如作業系統、芯片、資料庫等非常底層的根技術。
而機器人是一個非常新的賽道,特別是 AI 機器人,更適合一些叠代比較快的團隊。創業不僅要有一個好點子或好技術,更重要的是在正確的時間點做正確的事。
【晚點】:現在創業做人形機器人是正確的時間嗎?它需要的硬體、材料、能源等技術還不成熟,有些還在科學探索階段。一位資深科技投資人就說,他對 5-10 年後才會發生的事沒興趣。
彭誌輝:我們也沒想過短期就做成這件事。我們要求大家 「耐心地沖刺」,一方面叠代和創新速度要非常快,一方面要有耐心。
短期市場上會有各種正、負反饋,但對一家初創公司,最重要的是留在牌桌上。
【晚點】:留在牌桌很重要的一點是錢夠多。智元的融資速度和規模都領先同行。怎麽做到的?
彭誌輝:我覺得可以換位從投資人的角度看,他們為什麽會選我們?
首先我們有非常硬核的創始團隊背景;又有全棧技術布局:不只做本體,也不只做具身 AI,我們是本體、具身、數據都有布局,能力相對友商可能更全面;其次我們對整個賽道的理解也非常務實,一直在積累量產的系統能力,團隊的執行力超強。
去年釋出會(2023 年 8 月)時,我們整個人形研發團隊才不到 50 人,一年後的現在已經超過 300 人了。規模敢增長這麽快,前提是我們想清楚了要做什麽事情、各個階段的技術實作路徑,以及商業化的邏輯,這點也是投資人比較看重的。
【晚點】:智元長期想成為一家什麽樣的公司?有什麽對標物件?
彭誌輝:比如貝爾,貝爾發明電話,改變了大家資訊溝通的方式。人形機器人未來可能也會改變社會生產力。我們的公司願景就是 「用智慧機器去創造無限的生產力」。
智慧最終決定機器人能做什麽
【晚點】:創業一年多,人形機器人哪些方面比你預想的更難?
彭誌輝:從 0 做到 40、50 分,甚至 60 分都不算太難,但再往上就非常難。
本體成熟度還不夠。比如大部份人都在卷兩條腿走路,而雙臂的靈活度,靈巧手這些都還處於初級狀態。然後是智慧。現在大家都往模仿學習方向嘗試,但它真的能在復雜開放環境中達到很好的效果嗎?還有觸覺,聲音跟視覺結合起來的多模態融合感知、操作等,做得也不是非常好。這裏面有一部份是工程問題,還有一部份還處在科學問題階段,業內還沒有看到非常成熟的解決方案。
我們一邊落地一邊做預研,整個節奏要把握得比較穩,才能體現我們的有利競爭。全棧也是我們的一個優勢,所以未來可能會走得更遠一些。
智元機器人研發的靈巧手,與人手還有差距。人手有 27 個自由度、行動靈活,遍布高敏感的觸覺神經,力控能力強大。要做好靈巧手,靈活、耐用、穩定且成本可控的硬體部件和材料只是基礎,人手還具備手、腦協同能力,比如人能接住移動的物體,是因為人腦對重力、加速度等物理規律有認知,因而能預判軌跡,身體又有運動能力,才能完成這個看似簡單的動作。
【晚點】:我們了解到,智元在機器人的智慧上投入的人手更多。你們認為智慧比本體更重要?
彭誌輝:本體肯定是基礎,但我們一直覺得,(人形機器人)最核心的其實不是本體,而是它基於本體,能完成什麽實際任務,產生什麽有價值的套用。
所以本體的價值一定是透過具身來體現,你可以看到我們起名智元的初心:「智」 就是具身智慧,「元」 就是人形機器人本體的兩條腿(象形)。
【晚點】:一個人形機器人能站起來到能走,再到能上台階,是智慧問題嗎?
彭誌輝:它其實更多的是智慧問題,而不只是硬體問題。高階的運動能力主要靠大腦體現,在很多運動計畫中,正常人跟運動員的身體沒有本質區別,運動員更多是長期訓練中讓大小腦協同,對環境的感知、反饋達到了更好的狀態。
【晚點】:在獲取訓練數據的方法上,行業裏也有分歧。比如有公司認為,遙控操作機器人采集數據算不過來賬,應該用大量仿真數據。智元為什麽造上百台機器人專門采集數據?
彭誌輝:數據來源就那幾類:互聯網數據、仿真數據、真實采集的數據。如果只靠仿真和生成數據,會有可能出現用 ChatGPT 訓練大模型的情況,出現幻覺、Sim2Real Gap 等問題。所以真機數據必不可少,價值也最大,但它的量不會有仿真數據那麽大,可能占 10%。
還要考慮采整合本,有些公司硬體能力沒麽強。我們本體做得足夠好,所以才有條件在今年下半年有幾百台機器人能采集數據。我們會找到一些場景,讓人遙控操作不能自主執行任務的機器人。讓客戶為這一部份的功能買單,降低硬體成本。
【晚點】:在你的設想裏,通用人形機器人最終會是什麽樣的?
彭誌輝:就科幻電影裏的那種。比如 I,Robot。科幻電影拉高了大家的預期,但我們希望最終能做出來。
【晚點】:那是一種超人的狀態,而不是像人。
彭誌輝:可能很難有中間態。一旦人形機器人達到正常人類的水平,那它很快就會遠遠超過人類。
【晚點】:那個未來距離現在還有多遠?
彭誌輝:我比較樂觀,未來 10 年是有希望的。
人形機器人最早落地的場景是 「PPT」
【晚點】:你們說今年是智元商業化元年。其實不少人覺得,人形機器人還處於早期階段,剛學會走路,沒必要這麽快去上班。
彭誌輝:我們是一家商業公司,商業化是檢驗成果最有效的方式,把產品賣出去,客戶給了積極反饋,才能吸引到更多人才。一個落地遙遙無期、不太有希望的團隊,大家也不會加入。
【晚點】:你們說人形機器人商業化路徑是先工廠、後家庭,現在處於工廠階段,他們能做什麽場景?
彭誌輝:目前最快落地的就是 「PPT」,Pick(抓取)、Place(放置)和 Transfer(轉運)。
靈巧手更成熟後,還可以做各種裝配工作,因為靈巧手有觸覺、力覺等各種復雜感知能力。這個場景的量會更大,我們評估了一下,PPT 可能就只占整個制造行業場景的 20% 不到。
【晚點】:你們說今年就會賣出 300 台機器人。200 台有腿,100 台靠輪子移動。更具體來說,他們會做什麽工作?
彭誌輝:賣的主要是遠征系列,靈犀系列不賣,都開源。
遠征系列裏,雙足(人形機器人)的可靠性和自由度還要進一步叠代,現在更適合做一些體現人機互動能力的場景,主要是服務業。比如我們釋出會上展示的汽車門店裏的迎賓導覽。輪式的就是 A2-W,在工廠裏做 「PPT」 那些工作。
智元的人形機器人遠征 A2 在汽車門店當導購。
【晚點】:行業裏也有一些機器人公司,比如梅卡曼德、思靈等,給機械臂增加視覺、力控能力,用上大模型,在工廠裏也能做 PPT,而且他們已在穩定性和成本上打磨了更久。你們新方案的優勢是什麽?
彭誌輝:它們的確是機械臂廠商中最貼近具身智慧的公司。我們從單臂演化到了雙臂,然後還帶一個移動底盤,一些高層的雙臂規劃上,我們會有一些技術差異化。
比如典型的轉運場景中,用單臂搬一個托盤很難實作,雙臂做這個任務就更合理。從單臂到雙臂,聽起來很簡單,其實會涉及復雜的力控和雙臂配合、環境感知、動態避障、軌跡規劃等。更關鍵的是,以上這些能力我們要做成可以泛化的標準技能,降低機器人的部署成本。
智元機器人 A2-W 在工廠中搬托盤。
【晚點】:智元賣出去的 A2-W,已經能解決這些問題了?
彭誌輝:能解決一部份,重點是找到客戶需求和我們已有技術的匹配點。我們的投資人也比較給力,確實提供了一些很有價值、能在短期落地的場景。
【晚點】:剛才你也提到,你們非常在意成本。去年你說人形機器人要降到 20 萬以內。這個數位是怎麽算出來的?
彭誌輝:要看客戶的期待是什麽。一個工人的成本一年大概是 10 萬,機器人可以兩班倒。20 萬客戶差不多一年或一年半就能回本。我們也拆解了零部件成本,只要量足夠大,的確可以達到這個水平。
【晚點】:智元的產品距離 20 萬還有多遠?
彭誌輝:不遠了。我們批次發貨的目標成本就是這個,要不然可能就是虧本了。
【晚點】:你們的競爭對手會是誰?
彭誌輝:這個賽道足夠大,大家都還在做大蛋糕的階段,現在還沒有什麽直接競爭對手。
有一些潛在的競爭對手還沒下場。比如新能源車廠,它們有動力做這件事,如果人形機器人在產線上體現出價值,它們肯定會投資源做。它們也有能力做這件事,你看機器人本體上用到的各種核心零部件,電機、電控、電池等技術,就是新能源汽車擅長的那一套。
【晚點】:你預想的人形機器人很硬核,但現在商業化的產品看上去似乎很無聊。你會感到矛盾嗎?
彭誌輝:不沖突。我們是並列研發,都在做。我們有幾條線,一個是產品化、量產的線,一個是探索預研的線。我們經常在內部說,要吃著碗裏的,看著鍋裏的,還得想著田裏的。
像營運大公司那樣去創業
【晚點】:你們 8 月一次發了 5 個人形機器人產品,還賣關節電機、夾具、提供數據采集方案。今年還釋出了商業清潔機器人。你們的產品線是不是鋪得太開了?
彭誌輝:這其實是一個主線落地加很多支線探索,我們覺得還是有必要做這些布局的。我們叫飽和式投入。一方面我們有這個條件,同時整個賽道也還不太明確。
當然我們也會控制支線的資源投入。比如我們這次釋出了 X-Lab 實驗室做的兩款產品,全職參與的人其實不到 5 個,從全新的關節到結構軟硬體演算法都是這幾個人做的,在 X-Lab 我比較追求人效。
商業清潔機器人則是一個相對成熟的產品,能為我們人形的量產提供前置幫助,比如渠道、制造、售後等。它又能復用人形的一些能力,比如給清潔機器人加機械臂,讓它做更多事。
【晚點】:技術布局上,不少人形機器人公司都不做全棧,比如硬體本體上,一些公司不研究靈巧手,就用夾具;還有一些公司認為腿沒必要,只做上半身。具身智慧系統上,很多公司也會在強化學習、模仿學習中有側重。
彭誌輝:你得看各家公司擅長什麽或想做什麽。我們想用智慧機器去創造無限的生產力,就不得不關註全棧。這是從最終產品的競爭力出發的布局。
【晚點】:你們的計劃的開發節奏也很快:半年一代樣機,一年銷售一代產品。
彭誌輝:所有的創新都要永續,要考慮長期競爭力,並提前布局。創新的速度和創新一樣重要。
【晚點】:但人形機器人能做成什麽樣都不明確。智元怎麽確定每一代產品的叠代方向?
彭誌輝:就是剛才講的,把事情想清楚,具體要做哪些場景,怎麽做?需要什麽核心零部件和核心技術?
我們調研了很多客戶的需求,制造業的、服務業的。我們的股東也提供了很多輸入。從不同場景出發,我們提煉出技術路徑,發現有的更偏傳統自動化,有的更偏未來 AGI ,還存在一些中間狀態。這就是我們在釋出會上的 G1-G5 智慧演進路線。
智元目前商業化的產品處於 G2 階段,正在研發 G3 階段的系統。
【晚點】:同時做這麽多東西,又想做得快,這真的可能嗎?
彭誌輝:其實我們成立半年就做出了第一代人形機器人。首先是靠人才,大家的戰鬥力都很強。然後也有一些我的個人經驗積累,還有整個行業的發展,AI 技術大規模套用。
與前幾年相比,現在做這個事情的難度會降低一些。機器人的技術棧和新能源汽車很像,新能源汽車行業帶動了上遊制造業。在國內做通用機器人會有一些額外優勢。
智元第一代人形機器人遠征 A1。彭誌輝說,考慮到站在操作台前工作的場景,下半身采用關節往後彎的 「鴕鳥腿」。
【晚點】:團隊戰鬥力很強,怎麽衡量?
彭誌輝:就是工作效率,創新能力,還有投入程度。
【晚點】:很多公司的投入程度也高,也卷。這一點上你們怎麽能比對手更強?
彭誌輝:首先我們招人時,會盡量篩選誌同道合的人。比如價值觀要跟公司匹配。我會問他的興趣點是麽?比如 「如果你財務自由了,會不會繼續做現在崗位上做的事情?」 實際上我們公司的 Up 主濃度挺高的,他們都是因為熱愛主動投入的年輕人。
然後給足夠的信任,配足該配的資源;過程中鼓勵充分發揮主觀能動性,但是在驗收結果時,標準要提高;結果好的時候,給足夠多的激勵。
我們激勵方式比較多,年終獎之外也會給股權。我們未來的目標是跟華為一樣,優秀的同事都配股。
【晚點】:最近的釋出會上你也提到,機器人是一個非常復雜的軟硬體協同系統。你們需要同時做好很多事,怎麽讓各團隊高效協同?
彭誌輝:系統架構設計,是我們非常看重的能力。我們認為,人員的規模增長一定要有對應的組織能力,否則可能就是災難。我們的組織架構非常扁平,層級很少,一線研發上面是各個技術模組的研發經理,再上面就直接是我負責了。大家可以充分溝通交流,我們非常鼓勵及時反饋,暴露問題。
除了常規計畫開發流程外,我們還會以計畫攻關組的形式推進一些關鍵技術的突破。像核心零部件,我們會成立虛擬組織,成員承擔的職責更多,要求更高,但是做成之後的激勵也會更大。
【晚點】:智元除了自己招人開發,還跟北大合作建實驗室,甚至你們還收購了一個電機公司,早期公司很少這麽做。
彭誌輝:我們其實都是嘗試。比如說收購的電機團隊,其實只有兩個人,又比較出色,也給一些大品牌做過代工,反饋也不錯,我們就把他們吸納進來了。
【晚點】:多產品線、全棧技術布局、整合產業鏈,包括你們矩陣型的組織架構,感覺你們在用大公司的運作方式創業?
彭誌輝:可以這麽理解。但我們並不是為了表現得像大公司,而是因為當前的市場環境下,這種方式是最有效的。這是一個相對新興但迅速發展的領域,我們需要快速占領市場,展示我們的技術實力和產品願景。
大行業、大賽道最終都會收斂到頭部企業,如果只是小打小鬧,很難在快速變化的市場中保持領先地位。
「我不是天才」
【晚點】:有人說你是 「全棧溢位工程師」,可以焊電路板,造機器人,還能寫程式碼,訓練 AI 模型等。另外你也會彈吉他、剪視訊等。你有什麽特別的學習方法嗎?
彭誌輝:可能跟 AI 學習的方式有點像,早期靠一些過擬合,再用更多鍛煉,增加泛化性。多參考別人已有的經驗,先不要問為什麽,哪怕死記硬背,先記下來,慢慢就會理解背後的原理,然後再積極創新。跨領域掌握多個技能後,就會發現它們之間有相關性,一個領域的事情可能會幫你解釋另一個領域。
還有時間管理要做得非常好。大家都說我是時間管理大師什麽的。我喜歡用靠類似作業系統裏面的概念,叫搶占式排程,對要做的事情做動態優先級分配,不是做完一件事再做另外一件事,如果有更重要的事出現了,就去做它,做完再切回到之前做的那個事。每次只做一件事,分時保持專註,可能時間利用效率會比較高。
【晚點】:你的方法比較系統。之前我問宇樹科技王興興類似的問題,他說 「24 小時不睡覺,我不信解決不了」。
彭誌輝:我很多靈感也是睡覺前想起來的。日有所思,夜有所想。我也在夢裏想到過一些問題的解決方案,挺神奇的。不過有些事情可能很難,像數學,不會就是不會。
【晚點】:你剛才提到時間管理,哪怕是天才,一天也就 24 個小時。你現在投入這麽多精力創業,在其他方面犧牲會很多?
彭誌輝:對,現在基本上很少有周末。從去年創業到現在還沒有請過假。我個人還有些小習慣,我不太睡午覺,一天只吃一頓晚飯。
【晚點】:為什麽一天只吃一頓飯?能維持狀態嗎?
彭誌輝:有的時候確實忙,不太有時間,我覺得吃飯比較費時間。餓了也可以吃點零食嘛,身體也沒有什麽負面反饋,我覺得只要達到平衡就不算太壞的習慣。
【晚點】:創業一年多,給你印象最深的事是什麽?
彭誌輝:太多了。比如去年 8 月開第一次釋出會時,各種意義上都非常極限。釋出會前兩個多禮拜,我們研發的同學們基本就在會場打地鋪睡覺。
釋出會我們選了最有挑戰的直播形式,當我已經上台講了 20 分鐘後,才看到台下小夥伴比的 OK 手勢,我們終於解決完了最後一些 bug。
【晚點】:為什麽不能往後拖?
彭誌輝:已經拖過了,這是延過兩次之後的時間。還是得逼自己一把。
【晚點】:你之前都是一個人做計畫,現在你要帶一個團隊。你怎麽學習管理?
彭誌輝:一方面跟有經驗的前輩學習。另外就是在實戰中學,同時也有一些配合我做管理工作的夥伴幫忙。
【晚點】:那你還看書嗎?都看些什麽書?
彭誌輝:都在我辦公桌上,各種論文和書。長篇小說好像只看過【三體】,我喜歡硬科幻,是 big 劉的忠實粉絲,【三體】看了 10 多遍。
【晚點】:見到劉慈欣,你會跟他說什麽?
彭誌輝:給我簽個名。
【晚點】:現在應該有很多找你要簽名。遇到這種情況時,你在想啥?
彭誌輝:早知道就好好練練字了。
【晚點】:你身上有很多標簽,比如 B 站知名 UP 主、天才少年、明星公司聯合創始人、野生鋼鐵俠、全棧溢位工程師。你更喜歡哪個標簽?
彭誌輝:個人來說可能是工程師吧。我覺得搞技術還是很有意思的。假如我未來財務自由了,我不一定會去做視訊,但肯定會繼續做技術方面的事情。
【晚點】:你怎麽看 「天才少年」 這個稱號?
彭誌輝:我覺得我不是天才啊。大家也沒有必要這麽稱呼。我只是興趣使然,願意動手嘗試做一些東西出來,恰好遇上一個比較好的時代,和各種平台、機遇,做出了一點成果,更多的是努力和幸運吧。
【晚點】:你覺得什麽樣的人才能稱得上天才?
彭誌輝:他們的存在對整個世界的發展軌跡能有很大影響,比如大家在課本上看到的科學家們。
【晚點】:造出了真正的人形機器人,才算天才?
彭誌輝:我會把這個稱號讓給我們造出的機器人。
題圖來源:彭誌輝。