當前位置: 華文世界 > 科技

港科廣馬書根:算力累積並非智能,機理才是關鍵丨具身智能十人談

2024-07-11科技

作者丨饒舒瑋

編輯丨岑峰

仿生學,一向被認為是一門「古老又年輕」的學科。古老在於人類從直立行走時期就已經學會從自然界獲得靈感,年輕是因為不斷在模仿的過程中創造出新的事物。創造力,是人類區別於別的生物的一種本領,也是人類戰勝 AI 的一項天生能力。

在這個「AI 取代人類」言論喧囂塵上的時代,機器人開始進入家庭場景,大模型的出色表現讓人們不斷驚嘆,人們擔心人類和機器之間的界限逐漸模糊,焦慮情緒不斷蔓延。但在港科大(廣州)教授馬書根看來,「算力再高也算不出創造力」,對於人工智能威脅論他不擔心,他擔心的另有其事。

師從日本蛇形機器人之父,深耕機器人領域三十余年,馬書根自認為是「保守派」。當這個領域的熱錢不斷湧向人形機器人和大模型時,馬書根表示,社會資本應該往更需要的地方流動,而不是僅局限於智能方向。

具身智能的出現,讓硬件的重要性重新被看見。擁有仿生學背景的馬書根更加註重機器人在與外界環境互動時的身體表現。盡管仿生是從模仿開始,但是掌握機理,才是關鍵。在馬書根看來,如果沒有掌握機理,機器人就只能停留在按照指令完成動作,無法與外界環境實作互動,還遠沒有達到「具身智能」的程度。但要如何找到機理,如何驗證機理的正確性,馬書根仍在探索,這是一條尚待開拓的路。

對於機器人領域,馬書根有自己堅持的哲學思考。他始終認為,這個產業的發展目標不應該是全球經濟產值,而是對人類社會發展的影響,即利用機器解放人類勞動力,為人類擺脫繁重勞動的枷鎖,改變多數人因工作重負而情感枯竭的社會現狀,讓人們的生活重心回歸到個體之間的相處上。

在AI科技評論對馬書根教授的專訪中,我們可以了解到在傳統機器人領域對於具身智能的看法,以及仿生學發展對於具身智能的影響和當前面臨的行業挑戰等。

以下即為AI科技評論與馬書根就具身智能這一話題的訪談實錄,限於篇幅,AI科技評論進行了不改原意的編輯:

具身智能是身體與外界的互動

AI科技評論:當年您為何選擇赴日深造,又是如何確定的研究方向?

馬書根:因為在上世界80年代初期,日本在機器人領域處於世界領先地位,所以當時的留學目標就是日本。1985年,我畢業一年後就前往日本東京工業大學進行深造,跟隨梅谷陽二和廣瀨茂男兩位教授學習,他們自70年代末便開始研究蛇形機器人。

之所以選擇蛇形,主要還是我的興趣驅使。從科研的角度來說,研究蛇形機器人有兩點優勢,第一是蛇結構簡單,只有像一條繩索似的生物結構;第二是蛇的大腦較小,卻能控制全身運動,這對於我們如何在資源有限的情況下實作功能最大化的研究很有啟發。

當時的日本經濟繁榮,產業界對技術創新的需求迫切,從那時我開始意識到,僅僅依靠興趣驅動的研究難以在產業界獲得廣泛的認可和套用。我的導師也多次找我談話,給我提供了航天機器人這一方向,主要解決零重力環境下機器人減震的問題。

但我還是更偏向研究工業機器人,在我博士期間就開始研究工業機器人的多關節和象鼻機器人。博士畢業後我去了小松制造所開始工作。在小松呆了一年,我認識到工業界不太合適自己,想繼續赴美深造。於是我在1992年去了美國,1993年又回到日本成立了自己的實驗室,正式開始科研方面的工作。

AI科技評論:作為深耕機器人領域三十多年的學者,您怎麽理解具身智能?

馬書根:我們可以從一個簡單的例子出發理解其概念。比如,一條已經失去生命的魚,借助一定流速的水流就可以讓身體實作「遊動」的狀態。像這樣的身體形態與外界環境產生互動,正是具身智能的一個重要表現。

在我看來,具身智能包含兩種類別:一種是內在智能,它負責穩定身體內部的動態平衡;另一種則是從外界環境中獲取資訊,並根據這些資訊調整內部狀態以適應外界。

以人類為例,我們的日常技能並不只是透過教導完成,更多時候是身體為了適應環境進行主動學習。為了在不同的地形上穩定行走,我們的身體會自動調整姿勢和動作。這種適應力和反應能力,正是具身智能的體現。

在過去,人工智能領域更多地關註計算和數據處理等虛擬層面的能力,現在人們開始思考如何把大腦的智能部份轉移到身體上,從而在現實世界進行互動和操作,因此具身智能得以發展。

AI科技評論:仿生學這一學科背景對於您之後研究具身智能有何影響?

馬書根:運用仿生學的知識,我們可以透過觀測生物的運動方式,運用現有的控制方法來實作機器人與環境之間的互動。比如蛇在冰面上、在平地上、在崎嶇的地面上,就會出現不一樣的運動形態,這正是其內在智能的一種體現。生物體會根據其所處的不同環境演化出不同形狀和運動方式。

1994年前後,具身智能這一概念還沒出現,仿生學領域已經開始透過研究生物的動態行走來研發機器人,不僅僅是兩條腿的生物,還有四條、六條甚至八條腿的都有,像仿昆蟲的六條腿,仿蜘蛛的八條腿。像是現在的四足機器人就是動態模型,實際上和我們所研究的一脈相承。

但讓機器人走起來還不夠,還要實作穩定地行走,並具有承載重物的功能。要想實作穩定,最理想的狀態就是和地面有三條腿以上的接觸,保持穩定的三角結構。

從仿生學的角度來看,很多研究就是從觀察開始的。我們當時為了研究穩定行走這一課題參考了鱉這一生物,關註這類生物的運動機制。雖然研究工作往往從觀察開始,但我們不能僅停留在模仿現象的層面,而是應該理解其中的機理和內在的執行邏輯。

現在具身智能的研究也常提到大腦和小腦的類似功能,對此我持保留意見。有實驗顯示,有些生物即使切斷了某些神經但仍然能運動,會跟隨跑步機的速率變化改變自己的運動速度,這說明運動控制了並非全由大腦主導。

而人類的一些基本日常活動也並不需要用到小腦。類似漫步行走運動由脊髓等低階中樞所控制,它們驅動我們進行最基礎的運動,使得我們能夠自然地進行日常活動。但如騎行運動或跳水等復雜技能,就需要小腦協調訓練。

「先學後破再創造」

AI科技評論:仿生如何避免單純的模仿?您在研究仿生機器人時期,有遇到哪些印象深刻的技術挑戰?

馬書根:在仿生學研究中,每次都會遇到技術挑戰。比如在研究蛇的行動時,讓蛇按照預期爬上樹棍就很難,因為蛇不聽指揮。對於蛇的爬行動作,要研究各種爬的方法和樣式。像是我們想象的蛇上樹是轉圈往上,但其實蛇是曲線爬行,其中有些平衡機制需要考慮。同時,要想實作機器人完全像蛇一樣爬行還很困難,因為蛇關節短且柔軟,而機器則很難做到。

所以仿生也不並是完全模仿,要先學後破再創造。最初人類模仿鳥類用手臂上下拍動嘗試飛行但失敗了,後來靠核心機和固定翼才發明了飛機,之後才有了空氣動力學等研究出現。

就仿人機器人這一塊來看,「破」這一方面還有待發現。現在的人形機器人以電機為主,關節肌肉等模擬技術還在發展,短期內想要完全代替人類不太可能。

其實,仔細研究人體就會發現,人在完成動作時力學系統配合得很流暢合理。比如我們會發現快走比小跑還累,這是因為兩種運動的能量模式不一樣。人在走動時單腿擺動,重心有上下變化,向前走時重心會下降再上升。而跑步時不只是重心上下變化,你也會感覺到跟腱被拉伸。人走動速度不固定,有快有慢。速度低時勢能和動能有效傳遞,不需要太多肌肉能量;快速行走時,來源於重心上下變化的勢能遠遠達不到動能的需求,依靠肌肉提供更多的能量。人跑步時,不只重心上下的勢能還有跟腱的彈性勢能用於和動能有效傳遞,這樣比同速度走動需要較少的肌肉能量。所以感覺小跑比快走要輕松。

AI科技評論:不同於模擬環境,您認為面對復雜多變的現實環境,機器人可以如何應對?

馬書根:機器人需要透過傳感器獲取數據,辨識障礙物,再規劃動作,這個過程就是一整套的閉環控制。如果在其中某一環節沒能夠及時反應,就會導致其余環節脫節,可能出現機器人在高速運動時發生碰撞的情況。所以,我們提出了一個理念,即不能完全依賴認知來完成動作,而要透過機構設計實作。

在機構設計上,我們合理利用了欠驅動系統。比如,當機器遇到障礙物時,傳統思維是擡起或避開,但我們嘗試透過來源於障礙物推力被動改變運動模式來繼續前進。這種創新的設計思路讓我們在解決問題時有了更多的選擇。透過科研上的不斷進步,讓我們開始嘗試透過機構本身的調整來解決問題,從而實作更可靠更高效的移動方式。

例如,現在我們在研發機器人抓手的時候,經常需要面臨這麽一種情況,即如何在高速運動的時候提高抓取的魯棒性。按照一般的思路,一般會在機器人抓穩後再用驅動器吸取固定,但這樣驅動器數增加並控制會復雜。運用調整機構設計的方式,當遇到電機功率滿足「抓」這一動作後,可以讓同一電機驅動吸取機構移動,實作安全可靠抓取。同時利用氣壓驅動也能夠完成抓取和吸附動作,如此也能夠可靠的完成目標任務。

AI科技評論:在您看來,目前仿生機器人發展到什麽水平?未來的突破方向會是什麽?

馬書根:按滿分100分來看的話,目前的仿生水平未達到40分,一些動作像走動、跑動、翻跟鬥等,與人的動作還有差距。雖然像波士頓動力等公司的電機技術在近幾年有很大的進步,但像往上跳、打跟頭、背躍式跳高等高難度動作,要麽是所需電機功率太大,要麽是機體需要較大彈性,導致這些動作都很難實作。

尤其是在模擬人體肌肉的復雜性和協同性方面,目前的技術仍處於初級階段。人體在行走、奔跑乃至跳躍時,不僅依賴於四肢的力量,還涉及到腰部、背部等多塊肌肉的協同作用,這種全身性的動力鏈傳遞機制是現有機器人技術難以完全復制的。

剩下的60分,我認為突破的關鍵在於基本的驅動器,就如電梯平衡系數一樣,執行時所需的能量與自身重量比值越高越好,但目前我認為這一方面並未達標。相反演算法方面整體都有了很大的提高,也相對容易實作最佳化。但基於機理的演算法相對不足,需要硬件方面更要努力跟上。

無法算出的創造力

AI科技評論:您認為機器人領域突破發展瓶頸的關鍵點會是什麽?

馬書根:我認為是機理,我一直覺得現在的機器人研究始終沒有把握真正的機理。即使大模型出現後,這一部份也並沒有得到發展。

因為雖然大模型能夠幫助處理大量數據,並在感知到決策的過程中展現出了巨大的潛力,但因為其「黑箱」的特性也帶來了可靠性的問題。這也在某種程度上限制了工業界對於大模型的使用,特別是高精度高可靠性要求的領域。這些領域的企業需要有很明確的排障方案,而大模型因為難以解釋其決策依據往往找不出故障原因。

在算力還沒那麽強的上個世紀70年代,電腦領域尚可透過日積月累形成一定的機理基礎。到了八九十年代,電腦的算力逐步提升,但機理方面還沒有大的突破。如今,盡管這個領域有了很多突破,但其實很多都是因為算力的提升才得以解決,並不是因為對機理掌握程度的提高。

此外,盡管機器人技術日新月異,但機器人學科的基礎科學知識尚顯薄弱。在90年代中期,日本等國就開始探討這一問題,任何學科都一定要有堅實的基礎知識來支撐其發展。無論是機械、電子還是資訊科學,都需要在各自領域內深化基礎研究,才能推動機器人學科的成熟。

AI科技評論:機理可以透過什麽方式探索?未來的機器人發展方向會是什麽?

馬書根:目前沒有一個定論,也沒有方法可以驗證機理的正確性。所謂的機理都還是假設,需要有實際的東西來證明。

以人形機器人為例,盡管它目前非常熱門,但我們並不認為人形是機器人發展的唯一方向。機器人的形態應該根據具體套用場景和需求來確定,而不是盲目追求人形。

在功能上,我們更強調機器人的輔助性,它們應該能夠輔助人類完成一些危險、繁重或人類不願意從事的工作。試想一下,當危險系數很高的工程全部可以由機器人自動化完成,人類得以解放享受生活,那才是機器人真正理想的套用場景。而不是像現在的一些宣傳概念,機器人取代人類出現在日常的家庭場景中,尤其是在養老和育兒這兩大類看護型場景中,這才是人類最需要存在的地方。這類需要人類進行情感關懷的角色絕不能由機器人來承擔。

世界上的產值增加了多少,對於人類社會的發展來說並不是最關鍵的,如何利用自動化解放人類才是需要我們思考的東西。所以我認為目前的社會資本應該往更多需要的地方流動,而不是只局限在一個方向。

AI科技評論:您如何看待具身智能領域現在的發展現狀?

馬書根:具身智能這個領域現在學習演算法方向的年輕人多了,但是這個領域還很需要機器人方向的人才。學習演算法無可厚非,軟件實力也已經大大提升了,需要有一些新的東西出現。

要想做機器人的研究,不能光靠軟實力,必須兩條腿走路。演算法這方面現在相對來說比較容易解決,硬件背後的機理研究更需要受到重視。特別是在這個時代,人的創造力才是最重要的,這是無論怎樣提高算力都沒辦法從人工智能那裏得到的東西。創造力也沒辦法從書本裏的知識裏得出,很多時候反而是「玩出來」的。所以,我現在經常和學生說,別只是鉆研書本,要多接觸社會,要多看看外面的世界。

由市場決定科研價值

AI科技評論:在您看來,您怎麽衡量一個研究的科研價值?

馬書根:我現在衡量一個研究成果的科研價值時,主要考慮這個成果能不能經過市場經驗,實踐後能不能看到效果。總結此前與企業合作的經歷,我們更希望研發成果不僅只局限在某幾家企業套用,還能為更廣泛的套用場景提供借鑒。

舉例來說,當某鋼廠希望我們能設計一套管道檢測機器人時,我們更關註這一器材日後的套用和共性需求。比如,檢測的內容是什麽,這個尺寸是否適用於別的場景,如何確保檢測的準確性和效率等。我們更希望這套器材具備通用性,而不是只用於這一個公司。所以在研發的時候,提煉出適用於類似場景的共性技術,為未來的研究和套用提供有價值的參考,如此研發投入才更有意義。

我現在認為,在開始一個研究前,就要從實用性層面來思考,在這個場景裏到底需要什麽樣的形狀,什麽樣的材質,要達到什麽樣技術水平等。在我看來,科研價值可以分為兩種,一種是基礎科學, 像是數學、物理等學科知識,在全行業適用;一種是技能的套用,可以發展出什麽樣的產業,真正可以投入使用,這樣科研的價值才得以體現。

AI科技評論:您下一步想要攻克的科研方向是什麽?

馬書根:我希望研究出一種醫療機器人,可以直接進入人的身體,打通血管,解決血栓等問題,或是直接可以達到病竈,減少藥物對人身體的副作用。最後處理完,就可以透過某種方式變成營養增強人體抵抗力。

AI科技評論:能介紹一下您現在的研究專案嗎?

馬書根:我最近在研究適用於近海領域的水下機器人。這類水下機器人通常使用螺旋槳作為推進器。如果是在深海,這可能沒問題,但在近海就比較難實作,因為螺旋槳可能會卷死海洋植物,或者是在靠近海底面觀測時卷起雜質影響觀測等。

所以我們團隊希望透過仿生學的方式,研究什麽樣的機器人可以在不對生物造成影響的情況下進行作業,這在近海養殖等藍色經濟領域有比較大的需求。

雷峰網雷峰網雷峰網