智澄 AI CEO 胡魯輝：下一個 GPT 是物理智慧

2024-10-28科技

2022年底，ChatGPT 一經推出，不多久便點燃了全球的科技熱情，一眾圍繞大模型創業的公司紛紛湧現。一片喧鬧中，彼時在西雅圖 Meta的胡魯輝，將目光越過了生成式人工智慧大模型，望向註重感知與理解世界的物理智慧模型。

所謂物理智慧（Physical Intelligence），其核心在於使機器能夠感知、理解物理世界，並與之互動。近幾年，物理智慧成了熱門話題，不僅能在各路技術大牛的演講中頻頻聽到，史丹佛大學李飛飛老師更是直接創辦公司 World Labs，進行物理智慧領域的探索。

在胡魯輝老師看來，物理智慧會是繼 GPT 等資訊智慧之後、更具想象力的下一站，而機器人將是其最佳載體。正值國內具身智慧浪潮，胡魯輝決定結束西雅圖的安逸生活，回國創業，親自下場將自己的想法付諸實踐。

今年4月，胡魯輝在杭州創辦智澄AI，短短四個月後即推出了 TR1 和 TR2 兩款人工智慧機器人產品，並開啟了商業化行程。在他的設想裏，智澄 AI 會依據實際套用場景，進行「沿途下蛋」，推出適配的機器人產品。

胡魯輝在機器人圈或許是個「生面孔」，但在人工智慧領域，他卻是一個地道的行業老炮。作為一名資深的人工智慧專家，胡魯輝的職業旅程遍布了全球科技行業的一些重要地標。從早年留學美國，歷經微軟、亞馬遜、華為美國研究院，再到卸任的 Meta，胡魯輝在人工智慧領域積澱了十余年行業經驗。

此次創業，似乎是一場跨界行動，但對胡魯輝而言，是因為看到了其中蘊藏的機會。「目前機器人有許多難點、痛點，如成本高、泛化性差，要解決這些問題，僅靠硬體遠遠不夠，還需要從軟體和模型入手。」

「我們的核心技術是物理智慧，但我們不是只做物理智慧模型，而是要做軟硬體兼具的機器人。」這也是他對智澄 AI 的願景，做一個具有挑戰性的智慧機器人，最終推動機器人時代的到來。

圍繞此次創業，AI 科技評論與胡魯輝進行了一次深度對談。在交談中，他向我們展現了對物理智慧領域的深刻見解，同時，我們也能感受到胡魯輝對此次創業的熱情與信心。過往豐富的行業經歷，讓他為團隊拉來了一眾誌同道合的優秀人才；此外，多元的產業背景、此前成功的創業經歷，讓他對如何營運一家商業化科技公司有了自己的解法。

以下是 AI 科技評論與胡魯輝的對話。

相信機器人是未來

AI科技評論：您什麽時候有了創業想法？

胡魯輝：我一直都有創業的熱情。早在 2018年 AI 1.0 時代，我第一次回國創業將人工智慧與千億級零售業務智慧升級相結合，此外在Meta、華為、微軟、亞馬遜等科技巨頭的經歷我也深度參與了AI模型訓練、AI+資訊流、AI+雲端運算、AI+物流商流等一次次技術變革浪潮。這次 AI 2.0 時代來臨，我覺得機會比之前的浪潮更大，而且論創業環境，我認為國內機會更多，所以就決定回來了。

AI科技評論：您此前從事的方向更偏向於演算法軟體這塊，現在做機器人會不會又是另一個領域？

胡魯輝：其實機器人並非新東西，已有十來年、甚至更久。機器人此前也火過，後來由於各種原因又歸於平靜了。此次我們創業的初衷和主要目的，是因為相信機器人是未來、是下一個時代——機器人時代。

目前機器人發展處於一個尷尬階段，因為有兩大痛點。第一個是機器人特別貴，隨便一個人形機器人也需要好幾萬、幾十萬。相比之下，一輛不錯的汽車也就 20 來萬，但一個能表演的機器人也都要幾十萬，甚至功能不夠完善，只能表演；第二個痛點，是泛化技術有難度，可靠性、穩定性、工程性根本不行。然而這兩個問題相互關聯，要解決不能單靠硬體，還得要從模型和軟體入手，讓機器人變得更好、更智慧，能夠完成泛化作業。我們想解決機器人根本性問題，也就是機器人的數據和智慧的問題，大數據和人工智慧正是我的強項。

AI科技評論：您曾發表許多關於 AI 大模型相關內容，如今跨界做機器人，您的創業方向具體是什麽？

胡魯輝：針對機器人領域的挑戰，我們認為人工智慧是有效的解決方案，尤其是大模型。目前，大模型在人工智慧領域備受關註，如 ChatGPT 和國內月之暗面、智譜等，它們主要開發多模態大模型，用於構建互動式對話系統，即 Chatbot。

但是我們的產品將采用不同的技術路徑。我們專註於開發機器人，核心技術不是生成式多模態大模型，而是物理智慧，即對物理世界的感知和理解。今年4月，我在生成式人工智慧大會上也介紹了我們的創業方向，強調了物理智慧在機器人技術中的重要性。我們的目標是透過物理智慧技術，提升機器人的自主性和智慧化水平。

AI科技評論：所以你們做的不是單純的文本模型，而是理解物理世界的模型？

胡魯輝：我們正在自研物理世界模型，取名為「澄靈物理世界模型」，它專註於理解物理世界，與多模態大模型不同。我們區分這兩種智慧：多模態大模型屬於資訊智慧，如 Chatbot 這類人工智慧，主要處理資訊和互動；而我們的產品則屬於物理智慧，專註於感知和理解現實世界的物理規律。

AI科技評論：怎麽理解物理智慧？

胡魯輝：人工智慧的終極目標也許是實作通用人工智慧，而當前階段我們正處於生成式人工智慧的發展時期。這一觀點並非我首次提出，我與張亞勤院士交流時，了解到他在五年前就已提出人工智慧的發展路徑，從資訊智慧到物理智慧，最終達到通用人工智慧，這是一個逐步實作的過程。Meta 多年來也一直在討論世界模型的概念。今年6月，黃仁勛在台灣的演講中也提到，下一個人工智慧的發展方向是物理智慧。

生成式人工智慧處理的是一維或二維資訊的輸入，如文字、圖片、音訊或視訊，並輸出相同型別的資訊。物理智慧則在兩個層面上有所不同：首先，在輸入層面，我們處理的是感知和理解世界的數據，包括視覺和觸覺等感官資訊；其次，在輸出層面，我們生成的是TSD數據，即時間（T）序列（S）數據，這種數據可以直接用於控制機器人。

此外，生成式大模型和物理智慧的產品形態和套用場景也有所不同。生成式大模型不需要即時反饋，例如ChatGPT中有些資訊可能只更新到去年9月。而我們的系統必須即時處理輸入資訊，以確保機器人能夠及時響應。

AI科技評論：你們機器人的研發是基於人工智慧模型，演繹物理世界模型？

胡魯輝：對的。我們核心技術是物理世界模型，同時也做本體，打造一系列產品，目前已經推出了機器人產品 TR1，TR2。

AI科技評論：你們已經驗證了這條鏈路了是嗎？

胡魯輝：是的，除了清晰的 Northstar，也能逐步驗證和產品落地。

下一個 GPT 是物理智慧

AI科技評論：物理智慧是不是一定會和機器人結合？

胡魯輝：物理智慧不一定非要和機器人結合，只是我認為機器人領域或具身智慧是最理想的套用場景。好比，生成式人工智慧目前最好的套用是 Chatbot，但其實它也有很多其他場景可以用。

AI科技評論：一個能夠感知和理解世界的機器人，它的技術棧會包含哪幾塊？

胡魯輝：我認為主要是三個方面：第一，與物理世界的互動。與資訊智慧不同，物理智慧需要與現實世界進行互動；第二，演算法能力。物理智慧需要具備和生成式人工智慧一樣的演算法能力，因為它得要有泛化能力和推理使用能力；第三，即時性。物理智慧需要從三維、甚至四維（包含時空）的角度理解資訊，這與資訊智慧有本質的不同，因而要能夠即時處理和響應資訊。

AI科技評論：其實這也是具身智慧追求的目標。

胡魯輝：對，這就是個通用人工智慧。

AI科技評論：您是什麽時候有了要做物理智慧的這一想法？

胡魯輝：2022年年底，ChatGPT出來的時候。ChatGPT一經推出就在美國迅速走紅，因為大家看到了它不錯的泛化能力。國內對它的關註應該是在幾個月後逐漸升溫。當時我還在西雅圖，我開始思考我們應該如何跟進這一趨勢，也有不少創業公司開始圍繞 ChatGPT 進行創業。

那時，我也在 Meta 了解到世界模型的概念，而 Meta 首席 AI 科學家楊立昆對大模型並不特別熱衷。我也認為，繼 ChatGPT 之後，下一個重要的發展將是物理智慧，它將擁有更廣泛的套用前景。

AI科技評論：您會認為大模型對於機器人的發展是一個機遇？

胡魯輝：大模型是一種技術手段，類似於我們開發的世界模型，它也是一種大模型的表現形式，盡管具體的實作方式有所不同。這些模型都屬於基礎模型（foundation model），我們自主研發的世界模型同樣具備這樣的基礎模型特性。

AI科技評論：您怎麽看待通用人工智慧與通用機器人間的關系？

胡魯輝：通用人工智慧是人工智慧領域的終極目標，它指的是達到人類水平的智慧，這主要是從技術層面來講的。而通用機器人則是指具體的產品或套用。無論是通用人工智慧還是通用機器人，它們的核心目標都是實作「通用性」，而實作這一目標的關鍵在於掌握通用人工智慧的技術。

AI科技評論：基於物理世界模型開發機器人的路徑，國內目前還沒有相似公司？

胡魯輝：應該是沒有的。由於我司比較低調，我先提出這個想法時，並沒有引起太多人的興趣。但自從李飛飛老師和一些美國企業開始討論這個概念後，它就迅速受到了廣泛關註。

AI科技評論：在這波具身智慧浪潮中，你們的優勢是什麽？

胡魯輝：我覺得我們的優勢還是蠻多的，主要是四個方面。第一，我們專註於物理智慧領域，這是我們的核心技術和主要創新點；第二，我們的團隊成員基本都是來自頂級企業的高管，不僅擁有豐富的行業經驗，也有很多業務資源；第三，我們在敏捷交付方面展現出了強大的工程化實力，TR1 和 TR2 的出色表現證明了我們的執行力和交付能力；第四，我們與哈佛、清華等頂尖高校建立了合作關系，並得到了地方政府的支持，這為我們提供了強大的資源後盾。

讓通用世界模型成為硬體平台

AI科技評論：你們團隊今年才成立，但產品釋出很快，你們是不是很早就布局了？

胡魯輝：應該說是我們的團隊非常優秀，並且我們采用了亞馬遜的敏捷開發模式。亞馬遜的開發模式使我們每兩個月進行一次叠代，我們從今年5月份開始，大約兩個月推出一款新產品的節奏。在四個月的時間裏，我們成功推出了 TR1 和 TR2 兩款產品原型。

AI科技評論：你們現在團隊規模有多大？

胡魯輝：現在有 20 來人，基本以研發人員為主，研發團隊都是碩士以上，畢業於國內外名校。

AI科技評論：TR1 和 TR2 兩款產品已經量產了嗎？

胡魯輝：目前我們已經開始與意向客戶進行合作落地。

AI科技評論：這兩款產品的功能定位是什麽？

胡魯輝：我們致力於開發通用人工智慧和通用機器人，是因為想推動機器人時代的到來。與許多僅用於表演和研發的機器人不同，我們的目標是讓機器人能夠實際執行任務。要實作這一點，機器人的「手」是最關鍵的部份，因此我們的開發從手臂開始。我們的產品 TR1 是一款單臂機器人，而 TR2 則是一款雙臂機器人。我們希望能夠開發出更復雜、更具挑戰性的機器人，這也是我們的願景。

AI科技評論：那你們是做專用機器人，還是通用機器人？

胡魯輝：我們並不局限於機器人本體，而是會依據業務場景來做不同的機器人。

行動網際網路時代的一大標誌是 iPhone 的到來，iPhone 帶來的是硬體平台化，上面可以有不同app，而每一個app對應一個套用，說白了就是一個特定業務場景的解決方案。因此，我們希望將這一概念套用到物理世界智慧領域，打造一個平台化的模型，支持不同的硬體和機器人，以適應配送、工廠作業、家庭服務等多種場景。

AI科技評論：聽起來，你們是以人工智慧演算法為中心，再加不同本體，如人形、四足等，你們自己也做本體嗎？

胡魯輝：我們也會做本體。我們自己做設計，但我們不做生產。

AI科技評論：你們技術核心是不是在演算法驅動這塊？

胡魯輝：應該說是物理智慧層面，我們要打造物理智慧，也就是理解物理世界的人工智慧。

AI科技評論：你們接下來的產品計劃是什麽？

胡魯輝：我們的 TR1 和 TR2 產品將會持續進行叠代升級，在這個過程中，我們會繼續投入創新和研發工作。同時，我們會將產品與實際套用場景結合，逐步推動商業化行程，「沿途下蛋」。目前，我們已經收到了多家企業的合作意向。

AI科技評論：您覺得國內機器人領域的融資環境好嗎？你們融資困難嗎？

胡魯輝：整體環境我覺得一般，應該說沒有以前好，但現在人工智慧、AI 2.0還是很火爆的。

AI科技評論：與國內廠商競爭，你們會遇到什麽挑戰？

胡魯輝：我們的發展主要受兩大因素影響。一是科技發展的內在趨勢，二是商業環境的實際需求。作為一家商業化的科技公司，我們不僅要適應市場的變化，還要在技術上不斷實作突破。當然，這種情況也是許多企業在發展過程中需要面對的挑戰。

雷峰網雷峰網