【具身智能:從虛擬AI到現實AI】,杜雨 張孜銘 著,中譯出版社出版
智能,從何而來?它不僅來自大腦,也和身體息息相關。人工智能發展至今,正在從虛擬走向現實——人形機器人、自動駕駛汽車、智能家居產品……人工智能的大腦需要裝入不同的身體,才能更好地感知世界萬物。當感知化為認知,認知促成行動,最終所形成的便是具身智能。具身智能是人工智能的一個發展領域,指一種智能系統或機器能夠透過感知和互動與環境進行即時互動的能力。可以簡單理解為各種不同形態的機器人,讓它們在真實的物理環境下執行各種各樣的任務,來完成人工智能的前進演化過程。本書系統性地介紹了具身智能的技術原理、套用案例、發展機遇與挑戰,力圖為讀者展現一幅人機共生的未來藍圖。
>>內文選讀
你聽說過「缸中之腦」嗎?
這是希拉里·普特南(Hilary Putnam)1981年提出的著名思想實驗。在這個實驗中,你的大腦被從身體上切了下來,放進了充滿營養液的玻璃缸中。大腦的神經末梢都被連線在了電腦上,由電腦模擬出所有對於世界的感知和記憶。在這樣的假設下,一個基本問題就會暴露在所有人面前:「你如何保證現在的自己就不是缸中之腦呢?」
也許我們很難證明或證偽這個思想實驗,但卻可以把視角轉移到實驗背後的基本假設上——「我們的智能完全來自我們的大腦」。
圖源:視覺中國
這個假設非常具有唯物主義色彩,但似乎不那麽牢靠。假如人類都是全身長滿眼睛的球形體,似乎我們就很難具備有關自己「面前」和「背後」的相關認知;假如你在海鷗的身體內誕生,你對於這個世界的了解也肯定區別於在人類身體裏所形成的一切。我們所具備的知識、技能和智慧,不僅取決於我們的大腦,還取決於我們的身體,以及身體在和世界的互動中所獲得的反饋。
就像學習跳舞時,優秀的舞者從來不是靠畫面來記憶動作的,而是靠體驗去習得動作的。在我們起舞時,思想占據了我們的身體,所有感官變得活躍,透過感官,思想可以去感受、去聆聽,並遵循身體的智慧,最終形成了曼妙的舞姿。
感知化為認知,認知促成行動,這就是我們的智能,具備身體後形成的智能。
當人們想創造出擁有智能的機器時,自然也參考了這種思路。特別是到20世紀末期,人工智能領域行為主義學派的蓬勃發展,將這種思想逐步推向了高潮。相較於註重數理邏輯和推理的符號主義、模擬神經元仿生結構的聯結主義,行為主義起源於控制論,更關註在「感知—行動」的鏈路中,與現實環境不斷互動所誕生的智能。這一學派也在吸納其他學派思想精華的基礎上,持續引領著智能機器人等行業的繁榮。
直到今天,人們越來越發現,要想讓人工智能充分影響現實世界,需要將智能嵌入身體,在與環境的互動中不斷前進演化,這也是本書重點討論的主題——具身智能。不過,鑒於具身智能還是一個快速叠代的全新領域,本書會適當擴充套件這一概念的外延,把所有嵌入實物身體上的人工智能,統稱為具身智能。
當人工智能嵌入人形機器人時,它就變成了具身智能機器人;當人工智能嵌入汽車時,它就變成了自動駕駛汽車;當人工智能嵌入家居器材時,它就變成了智能家居產品。可以說,人工智能在嵌入實物身體的同時,也嵌入了我們的生活,影響著我們生活的方方面面。
智能的人形機器人,可以更加適配人類的生活場景,現實世界的建築、工具、設施都是為人類所設計的,人形的具身智能機器人很容易就能幫我們分擔各種家務和工作。自動駕駛的汽車,不僅可以方便人們的出行、減緩司機長途駕駛的疲憊,還可以改善整個交通系統的運作效率。而智能家居,在讓我們的日常生活變得更輕松的同時,也讓整個家庭環境變得更加安全與溫馨。相信在不久的將來,我們的世界就會變成人類與機器和諧相處的世界。
2023年初,針對ChatGPT等AIGC領域的技術爆發,許多教育界的專家學者已對未來「機器替代」的趨勢展開了密切的討論,並重新審視了當今中國的教育現狀。而面對未來具身智能的發展,當強大的AI擁有了身體,中國的教育又該何去何從,這無疑是同樣重要的話題。
教育是一個國家新生的潛質變量,教育更好才會有更好的人才,綜合國力才可能會更強。當具身智能與教育領域相遇時,我們面對的是對既有教育模式的重新評估,以及如何整合這一新興趨勢來最佳化教育體系的問題。從宏觀上來看,具身智能與教育的結合存在方向上的分歧,這也是培養下一代人成長的交叉和分歧點。從微觀上看,在學校的教育環境中,是否應該引入具身智能等人工智能技術來協助教育學習過程,許多學校還舉棋不定。參考之前AIGC領域的發展,一些學校反對學生使用ChatGPT寫論文,但也有部份學校支持學生使用。解決分歧,在保證教育質素的同時,不阻礙新技術的積極影響,將會是未來推進具身智能在教育領域套用的重要命題。
●具身智能教育套用的相關案例
雖然具身智能在教育領域的套用尚不成熟,但我們仍能看到許多優秀的早期案例。在下面的內容中,我們將對部份案例進行介紹。
1.機器人Furhat
2022年,瑞典的一家初創公司FurhatRobotics推出了一款智能機器人Furhat,這款機器人可以透過面部表情、聲音和身體語言與人進行自然的交談。相比於傳統的互動式機器人,Furhat最大的特點是具有高度的面部表現力,這種表現力來自自然的頭部運動、流暢的面部姿勢以及與眼睛註視的結合。此外,該機器人還內建了臉部和眼睛的微動等行為,給人以真人一樣的感覺,例如在強調某個詞或瞥一眼另一個人時,它會微微揚起眉毛。
除了依靠臉部動畫和3D建模打造面部外,Furhat還具有超強的感知和互動能力。Furhat能夠使用電腦視覺技術即時跟蹤多個使用者,進行面部表情分析,估計頭部姿勢和使用者距離,還能透過組合的視覺和音訊輸入,最多與10個人進行互動,並在互動中記住和區分他們。在互動時,它不僅能在嘈雜環境中精準地捕捉聲音,還具有強大的自然語言理解能力,支持多語種流暢對話。在對話中,它還會分析使用者的參與度、註意力以及內心狀態,用目光或微笑給予幸福、驚訝、憤怒、悲傷等情緒回應。
Furhat已經擁有實際的工作經驗,它曾在德國法蘭克福機場擔任引導員(圖源:網絡資料圖片)
當前,Furhat在教育領域可以扮演多樣化的角色,既能幫助孩子在學習上進步,也能提升孩子的社交能力和創新思維。在學習方面,Furhat可以模擬真人口語交談場景,幫助孩子練習外語,增強他們的語言運用,也可以設定進行各種學科的模擬訓練,比如數學題目解答、科學知識講解等,幫助孩子們提升具體的學習技能。透過和機器人進行互動,孩子們可以學習社交規則和增強自己的社交能力。不僅如此,它還能理解和回應人類情緒,提供情緒上的支持和安慰,陪伴孩子度過孤獨的時刻。
2.機器人Misa
Misa由Misa Robotics LLC公司研發,能夠在日常生活中扮演各種角色,幫助使用者的生活更加便捷。Misa可以利用先進的自然語言理解功能以及語音與周圍的人進行互動和交流,從而與家人建立關系,並且其獨特的互動性和移動性,可以使它在家與孩子一起玩耍、感知障礙物。在教育孩子方面,Misa將寓教於樂這一點落實得很好,熱衷於激發孩子們的玩耍、參與和創造力,作為他們未來成功的基礎。Misa內建了豐富的教育App,包括數學、科學、編程、語言學習等各種學科,可以滿足不同年齡、不同興趣的孩子們的學習需求。而且,與傳統的書本學習相比,Misa以遊戲和互動的方式進行教學,使孩子在玩耍的同時也能學到知識。Misa的高度互動性,能夠對孩子的命令或問題進行反饋。這不僅能吸引孩子的註意力,也能激發他們探索和學習的興趣。除了學科教育外,Misa在生活教育方面做得同樣出色,可以透過故事、影片、互動遊戲等形式,為孩子灌輸正確的行為舉止與健康的生活習慣。此外,Misa還具有兒童安全模式,可以防止孩子接觸不適當的內容,保證安全的線上學習環境。同時,即使父母不在家也能透過影片通話的功能看著孩子做作業,或者由老師遠端輔導。
3.Cobot S Kit
為了更廣泛地培養具身智能領域的人才,針對該領域的科研教育建設是必不可少的。針對這一場景,松靈機器人推出了Cobot S Kit的具身智能科研教育平台。Cobot S Kit的科研教育解決方案深度整合了移動機器人平台、精確傳感、AI大模型技術,以及靈活的機械臂設計,為科研教育提供了一個優質的模擬實驗環境。Cobot S Kit的配置足以滿足科研教育實踐的高標準要求,它搭載了高精度的傳感技術,配合強大的算力為機器人提供了在復雜環境中的即時建圖、路徑規劃、自主導航及動態避障的能力。而其輕量級6軸機械臂和夾持式機械夾爪,可以讓學生輕松完成機械臂的運動學習、仿真、運動路徑規劃和運動控制等相關任務的實踐。
此外,頂端雲台搭載的相機系統類比於人的頭部和視覺系統,增強了機器人的環境感知和適應能力,讓機器人能夠更為全面地評估各種環境變化並適應不同的任務需求,並且內部還嵌入了先進的視覺抓取技術,可以實作從不同角度和距離對各類物體的精確抓握。更具特色的是,Cobo S Kit還具備大模型訓練的接入能力,不僅能支持如ChatGPT這樣的大模型,還能夠在特定場景下進行機器人程式的設計與訓練,極大地增加了學習過程的實踐性和互動性。利用這樣的平台進行具身智能領域的科研教學,不僅能讓教學過程變得更加直觀,而且也有助於提升學生的動手實踐能力。
(本文摘編自本書前言及第七章)
作者:
文:杜雨 張孜銘編輯:金久超責任編輯:朱自奮