2022年底,ChatGPT 一經推出,不多久便點燃了全球的科技熱情,一眾圍繞大模型創業的公司紛紛湧現。一片喧鬧中,彼時在西雅圖 Meta的胡魯輝,將目光越過了生成式人工智慧大模型,望向註重感知與理解世界的物理智慧模型。
所謂物理智慧(Physical Intelligence),其核心在於使機器能夠感知、理解物理世界,並與之互動。近幾年,物理智慧成了熱門話題,不僅能在各路技術大牛的演講中頻頻聽到,史丹佛大學李飛飛老師更是直接創辦公司 World Labs,進行物理智慧領域的探索。
在胡魯輝老師看來,物理智慧會是繼 GPT 等資訊智慧之後、更具想象力的下一站,而機器人將是其最佳載體。正值國內具身智慧浪潮,胡魯輝決定結束西雅圖的安逸生活,回國創業,親自下場將自己的想法付諸實踐。
今年4月,胡魯輝在杭州創辦智澄AI,短短四個月後即推出了 TR1 和 TR2 兩款人工智慧機器人產品,並開啟了商業化行程。在他的設想裏,智澄 AI 會依據實際套用場景,進行「沿途下蛋」,推出適配的機器人產品。
胡魯輝在機器人圈或許是個「生面孔」,但在人工智慧領域,他卻是一個地道的行業老炮。作為一名資深的人工智慧專家,胡魯輝的職業旅程遍布了全球科技行業的一些重要地標。從早年留學美國,歷經微軟、亞馬遜、華為美國研究院,再到卸任的 Meta,胡魯輝在人工智慧領域積澱了十余年行業經驗。
此次創業,似乎是一場跨界行動,但對胡魯輝而言,是因為看到了其中蘊藏的機會。「目前機器人有許多難點、痛點,如成本高、泛化性差,要解決這些問題,僅靠硬體遠遠不夠,還需要從軟體和模型入手。」
「我們的核心技術是物理智慧,但我們不是只做物理智慧模型,而是要做軟硬體兼具的機器人。」這也是他對智澄 AI 的願景,做一個具有挑戰性的智慧機器人,最終推動機器人時代的到來。
圍繞此次創業,AI 科技評論與胡魯輝進行了一次深度對談。在交談中,他向我們展現了對物理智慧領域的深刻見解,同時,我們也能感受到胡魯輝對此次創業的熱情與信心。過往豐富的行業經歷,讓他為團隊拉來了一眾誌同道合的優秀人才;此外,多元的產業背景、此前成功的創業經歷,讓他對如何營運一家商業化科技公司有了自己的解法。
以下是 AI 科技評論與胡魯輝的對話。
相信機器人是未來
AI科技評論:您什麽時候有了創業想法?
胡魯輝:我一直都有創業的熱情。早在 2018年 AI 1.0 時代,我第一次回國創業將人工智慧與千億級零售業務智慧升級相結合,此外在Meta、華為、微軟、亞馬遜等科技巨頭的經歷我也深度參與了AI模型訓練、AI+資訊流、AI+雲端運算、AI+物流商流等一次次技術變革浪潮。這次 AI 2.0 時代來臨,我覺得機會比之前的浪潮更大,而且論創業環境,我認為國內機會更多,所以就決定回來了。
AI科技評論:您此前從事的方向更偏向於演算法軟體這塊,現在做機器人會不會又是另一個領域?
胡魯輝:其實機器人並非新東西,已有十來年、甚至更久。機器人此前也火過,後來由於各種原因又歸於平靜了。此次我們創業的初衷和主要目的,是因為相信機器人是未來、是下一個時代——機器人時代。
目前機器人發展處於一個尷尬階段,因為有兩大痛點。第一個是機器人特別貴,隨便一個人形機器人也需要好幾萬、幾十萬。相比之下,一輛不錯的汽車也就 20 來萬,但一個能表演的機器人也都要幾十萬,甚至功能不夠完善,只能表演;第二個痛點,是泛化技術有難度,可靠性、穩定性、工程性根本不行。然而這兩個問題相互關聯,要解決不能單靠硬體,還得要從模型和軟體入手,讓機器人變得更好、更智慧,能夠完成泛化作業。我們想解決機器人根本性問題,也就是機器人的數據和智慧的問題,大數據和人工智慧正是我的強項。
AI科技評論:您曾發表許多關於 AI 大模型相關內容,如今跨界做機器人,您的創業方向具體是什麽?
胡魯輝:針對機器人領域的挑戰,我們認為人工智慧是有效的解決方案,尤其是大模型。目前,大模型在人工智慧領域備受關註,如 ChatGPT 和國內月之暗面、智譜等,它們主要開發多模態大模型,用於構建互動式對話系統,即 Chatbot。
但是我們的產品將采用不同的技術路徑。我們專註於開發機器人,核心技術不是生成式多模態大模型,而是物理智慧,即對物理世界的感知和理解。今年4月,我在生成式人工智慧大會上也介紹了我們的創業方向,強調了物理智慧在機器人技術中的重要性。我們的目標是透過物理智慧技術,提升機器人的自主性和智慧化水平。
AI科技評論:所以你們做的不是單純的文本模型,而是理解物理世界的模型?
胡魯輝:我們正在自研物理世界模型,取名為「澄靈物理世界模型」,它專註於理解物理世界,與多模態大模型不同。我們區分這兩種智慧:多模態大模型屬於資訊智慧,如 Chatbot 這類人工智慧,主要處理資訊和互動;而我們的產品則屬於物理智慧,專註於感知和理解現實世界的物理規律。
AI科技評論:怎麽理解物理智慧?
胡魯輝:人工智慧的終極目標也許是實作通用人工智慧,而當前階段我們正處於生成式人工智慧的發展時期。這一觀點並非我首次提出,我與張亞勤院士交流時,了解到他在五年前就已提出人工智慧的發展路徑,從資訊智慧到物理智慧,最終達到通用人工智慧,這是一個逐步實作的過程。Meta 多年來也一直在討論世界模型的概念。今年6月,黃仁勛在台灣的演講中也提到,下一個人工智慧的發展方向是物理智慧。
生成式人工智慧處理的是一維或二維資訊的輸入,如文字、圖片、音訊或視訊,並輸出相同型別的資訊。物理智慧則在兩個層面上有所不同:首先,在輸入層面,我們處理的是感知和理解世界的數據,包括視覺和觸覺等感官資訊;其次,在輸出層面,我們生成的是TSD數據,即時間(T)序列(S)數據,這種數據可以直接用於控制機器人。
此外,生成式大模型和物理智慧的產品形態和套用場景也有所不同。生成式大模型不需要即時反饋,例如ChatGPT中有些資訊可能只更新到去年9月。而我們的系統必須即時處理輸入資訊,以確保機器人能夠及時響應。
AI科技評論:你們機器人的研發是基於人工智慧模型,演繹物理世界模型?
胡魯輝:對的。我們核心技術是物理世界模型,同時也做本體,打造一系列產品,目前已經推出了機器人產品 TR1,TR2。
AI科技評論:你們已經驗證了這條鏈路了是嗎?
胡魯輝:是的,除了清晰的 Northstar,也能逐步驗證和產品落地。
下一個 GPT 是物理智慧
AI科技評論:物理智慧是不是一定會和機器人結合?
胡魯輝:物理智慧不一定非要和機器人結合,只是我認為機器人領域或具身智慧是最理想的套用場景。好比,生成式人工智慧目前最好的套用是 Chatbot,但其實它也有很多其他場景可以用。
AI科技評論:一個能夠感知和理解世界的機器人,它的技術棧會包含哪幾塊?
胡魯輝:我認為主要是三個方面:第一,與物理世界的互動。與資訊智慧不同,物理智慧需要與現實世界進行互動;第二,演算法能力。物理智慧需要具備和生成式人工智慧一樣的演算法能力,因為它得要有泛化能力和推理使用能力;第三,即時性。物理智慧需要從三維、甚至四維(包含時空)的角度理解資訊,這與資訊智慧有本質的不同,因而要能夠即時處理和響應資訊。
AI科技評論:其實這也是具身智慧追求的目標。
胡魯輝:對,這就是個通用人工智慧。
AI科技評論:您是什麽時候有了要做物理智慧的這一想法?
胡魯輝:2022年年底,ChatGPT出來的時候。ChatGPT一經推出就在美國迅速走紅,因為大家看到了它不錯的泛化能力。國內對它的關註應該是在幾個月後逐漸升溫。當時我還在西雅圖,我開始思考我們應該如何跟進這一趨勢,也有不少創業公司開始圍繞 ChatGPT 進行創業。
那時,我也在 Meta 了解到世界模型的概念,而 Meta 首席 AI 科學家楊立昆對大模型並不特別熱衷。我也認為,繼 ChatGPT 之後,下一個重要的發展將是物理智慧,它將擁有更廣泛的套用前景。
AI科技評論:您會認為大模型對於機器人的發展是一個機遇?
胡魯輝:大模型是一種技術手段,類似於我們開發的世界模型,它也是一種大模型的表現形式,盡管具體的實作方式有所不同。這些模型都屬於基礎模型(foundation model),我們自主研發的世界模型同樣具備這樣的基礎模型特性。
AI科技評論:您怎麽看待通用人工智慧與通用機器人間的關系?
胡魯輝:通用人工智慧是人工智慧領域的終極目標,它指的是達到人類水平的智慧,這主要是從技術層面來講的。而通用機器人則是指具體的產品或套用。無論是通用人工智慧還是通用機器人,它們的核心目標都是實作「通用性」,而實作這一目標的關鍵在於掌握通用人工智慧的技術。
AI科技評論:基於物理世界模型開發機器人的路徑,國內目前還沒有相似公司?
胡魯輝:應該是沒有的。由於我司比較低調,我先提出這個想法時,並沒有引起太多人的興趣。但自從李飛飛老師和一些美國企業開始討論這個概念後,它就迅速受到了廣泛關註。
AI科技評論:在這波具身智慧浪潮中,你們的優勢是什麽?
胡魯輝:我覺得我們的優勢還是蠻多的,主要是四個方面。第一,我們專註於物理智慧領域,這是我們的核心技術和主要創新點;第二,我們的團隊成員基本都是來自頂級企業的高管,不僅擁有豐富的行業經驗,也有很多業務資源;第三,我們在敏捷交付方面展現出了強大的工程化實力,TR1 和 TR2 的出色表現證明了我們的執行力和交付能力;第四,我們與哈佛、清華等頂尖高校建立了合作關系,並得到了地方政府的支持,這為我們提供了強大的資源後盾。
讓通用世界模型成為硬體平台
AI科技評論:你們團隊今年才成立,但產品釋出很快,你們是不是很早就布局了?
胡魯輝:應該說是我們的團隊非常優秀,並且我們采用了亞馬遜的敏捷開發模式。亞馬遜的開發模式使我們每兩個月進行一次叠代,我們從今年5月份開始,大約兩個月推出一款新產品的節奏。在四個月的時間裏,我們成功推出了 TR1 和 TR2 兩款產品原型。
AI科技評論:你們現在團隊規模有多大?
胡魯輝:現在有 20 來人,基本以研發人員為主,研發團隊都是碩士以上,畢業於國內外名校。
AI科技評論:TR1 和 TR2 兩款產品已經量產了嗎?
胡魯輝:目前我們已經開始與意向客戶進行合作落地。
AI科技評論:這兩款產品的功能定位是什麽?
胡魯輝:我們致力於開發通用人工智慧和通用機器人,是因為想推動機器人時代的到來。與許多僅用於表演和研發的機器人不同,我們的目標是讓機器人能夠實際執行任務。要實作這一點,機器人的「手」是最關鍵的部份,因此我們的開發從手臂開始。我們的產品 TR1 是一款單臂機器人,而 TR2 則是一款雙臂機器人。我們希望能夠開發出更復雜、更具挑戰性的機器人,這也是我們的願景。
AI科技評論:那你們是做專用機器人,還是通用機器人?
胡魯輝:我們並不局限於機器人本體,而是會依據業務場景來做不同的機器人。
行動網際網路時代的一大標誌是 iPhone 的到來,iPhone 帶來的是硬體平台化,上面可以有不同app,而每一個app對應一個套用,說白了就是一個特定業務場景的解決方案。因此,我們希望將這一概念套用到物理世界智慧領域,打造一個平台化的模型,支持不同的硬體和機器人,以適應配送、工廠作業、家庭服務等多種場景。
AI科技評論:聽起來,你們是以人工智慧演算法為中心,再加不同本體,如人形、四足等,你們自己也做本體嗎?
胡魯輝:我們也會做本體。我們自己做設計,但我們不做生產。
AI科技評論:你們技術核心是不是在演算法驅動這塊?
胡魯輝:應該說是物理智慧層面,我們要打造物理智慧,也就是理解物理世界的人工智慧。
AI科技評論:你們接下來的產品計劃是什麽?
胡魯輝:我們的 TR1 和 TR2 產品將會持續進行叠代升級,在這個過程中,我們會繼續投入創新和研發工作。同時,我們會將產品與實際套用場景結合,逐步推動商業化行程,「沿途下蛋」。目前,我們已經收到了多家企業的合作意向。
AI科技評論:您覺得國內機器人領域的融資環境好嗎?你們融資困難嗎?
胡魯輝:整體環境我覺得一般,應該說沒有以前好,但現在人工智慧、AI 2.0還是很火爆的。
AI科技評論:與國內廠商競爭,你們會遇到什麽挑戰?
胡魯輝:我們的發展主要受兩大因素影響。一是科技發展的內在趨勢,二是商業環境的實際需求。作為一家商業化的科技公司,我們不僅要適應市場的變化,還要在技術上不斷實作突破。當然,這種情況也是許多企業在發展過程中需要面對的挑戰。
雷峰網雷峰網