當前位置: 華文世界 > 科技

工業機器人,因為 AI 迎來 「智慧時代」

2024-04-02科技

編者按:

從 ChatGPT 開始,整個世界都為生成式 AI 瘋狂不已,當大模型開始有能力「像人一樣思考」,那麽造一台真正智慧的機器的時代,是否也已經到來。

從伊隆·馬斯克的特斯拉,再到 OpenAI、微軟和亞馬遜,幾乎所有 AI 巨頭都對人形機器人行業押下重註。

不過,具身智慧在真正進入千萬家庭之前,他們的第一個真正的套用場景,反而可能是工廠——讓工業機器人因為 AI 而具備更高的智慧,才可能是具身智慧發展起來的根本。而人們頭腦中想象的人形機器人,可能並不是具身智慧工業機器人的最佳形態。

為此,微億智造科技有限公司 CTO 趙何博士、上海捷勃特機器人有限公司 CTO 賀巖,前者主攻工業 AI+機器人智慧控制,後者是專業的工業機器人研發及制造商,兩位深耕在 AI 和機器人領域的專家,從機器人智慧的歷史出發,撰文論述為什麽具身智慧工業機器人的時代,已經到來。

以下為【你好,具身智慧工業機器人】全文:

01「你好,具身智慧」

具身智慧 :「探索-利用」的學習範式

具身智慧理論根源於「具身認知」(Embodied Recognition),包括人類在內的一切智慧體的認知能力是由智慧體自身結構決定的,並在此基礎上構建自己的世界模型。而這種認知又直接影響智慧體的高級心理活動,諸如:推理,決策等。

從認知產生的機制到智慧體決策依賴的世界模型,均受制於智慧體具體的物質形態。具身智慧理論挑戰了包括笛卡爾二元論在內的諸多認知理論,建立起了將「身」與「智」統一的理論框架,將智慧體和周圍環境看作一個系統,透過「軀體」與外界環境進行互動,再從外界對智慧體的動作產生的反饋獲取資訊,建立對環境的認知。整個認知過程遵循「探索-利用」(exploration-exploitation)的範式。

具身智慧理論強調了智慧體與環境之間的強關聯,「智慧」本質上是這兩個實體的總和。以建立這個總和為共同目的,具身智慧體必須具有一些最基本的通用能力。包括:

空間認知能力

空間認知能力是這個世界裏智慧體的基本能力之一,這個過程其實是智慧體對外部物理世界的實體先進行「解構」,然後用抽象的幾何模型在心理層面對外部世界進行「建構」的過程。

移動導航能力

如果空間認知能力是智慧體對宏觀世界的抽象,那麽移動導航能力則是智慧體對自身所處的微觀環境的適應。透過「探索-利用」的學習範式發現知識,積累經驗,提高智慧,在自然前進演化中勝出。

具身智慧

硬體為「智慧」而生

長期以來,人工智慧的發展主要致力於如何在通用的硬體上實作更好的智慧,而沒有充分考慮如何以智慧需求為導向驅動新型硬體的開發。也許,將「硬體為智慧而生」提升到具身智慧發展應秉持的原則高度並不為過。從近些年的行業發展來看,這種趨勢其實已經初見端倪。可以預見,具身智慧的發展會將這一原則擴散到所有硬體的設計生產中,促使套用從「自發」走向「自覺」。

以具身智慧為共同理論基礎的硬體,它們在基本功能的要求上存在共性,歸納起來表現:在多模態的環境認知及透過語言、視覺方式的互動能力;智慧的任務學習和理解能力,並基於內部世界模型把任務轉化成內部結構化表示;在自身軟硬體系統上,實作高度自主的智慧決策能力,以應對全新、突發的情況;智慧高效的單任務執行能力,基本不需要、或僅偶爾需要非常少量的人工幹預;以及智慧的多工作切換能力。

具身智慧理論明確了智慧與軀體之間的耦合,論述了智慧體和環境之間的關系。因此,在設計具身智慧產品時,不能把它從任務環境中剝離出來孤立地考慮。

02 你好,具身智慧工業機器人

早期工業機器人主要用於重復性、單一性的任務。隨著新技術的發展,逐漸實作自動化,能執行更復雜、精細的任務。然而發展到今天,工業機器人正遭遇技術發展瓶頸,面臨成本、復雜性、靈活性和人機協作等困難和挑戰。

與此同時人工智慧技術迅猛發展,深度學習技術在語音及影像辨識、自然語言處理等任務上取得了突破性的進展。近兩年多模態大模型技術的發展,更是奠定了實作人機自然互動的技術基礎。「人工智慧+」成為積極探索的領域。

一邊是早已發展成熟、遭遇瓶頸、苦苦尋找新發展的行業;一邊是如日中天、帶著變革、顛覆的光環急於尋找用武之地的新興技術。人類固有的敏感和直覺告訴我們,歷史到了一個迫切需要將兩者融合的時刻,結出最驚艷的果實:你好,具身智慧工業機器人!

以具身智慧理論作為指導,將成熟的工業機器人與新興的人工智慧技術融合,誕生了「具身智慧工業機器人」(Embodied Intelligent Industrial Robots, EIIR)。

EIIR 的本質:解放「人」超越「人」

EIIR 的生存環境就是工業生產環境。充分考察 EIIR 的生存環境可以幫助我們辨識其應該具有的形態。由此我們可以得出結論:人形機器人不是 EIIR 的形態。相對於自然環境,生產環境是一個閉合、簡單的環境。從邏輯上講,「人形」作為開放環境下的產物天然不會是閉合環境最佳的軀體形態。其次,生產環境是人為設計制造出來的,如果可以由機器自主完成而不需要人的參與,那麽對應的生產環境可以設計成對機器更加友好,而完全不用考慮人類體形的局限,從而讓生產過程更加高效可靠。

「人形」適配的是人的生存環境,而非工業的生產環境 | 來源:視覺中國

EIIR 需要替代的是人在生產過程中被異化後的投影,不是人的本質,更不是人的外形。進一步,EIIR 還需要把替代的人類能力在生產環境中放大、強化,充分利用 EIIR 作為機器的同時,發揮出超出人類的效能,使得將人類從生產活動中解放出來成為可能和必要。相比精確的自動化控制,EIIR 可以更好的實作真正的無人化生產,正是因為:

生產場景的不確定性

從定性角度來看,工業場景在宏觀上是閉合有界的。但在微觀層面,工業場景下也存在諸多不確定因素,是一個定量上開放的環境,這就需要有靈巧的智慧能力來應對這類不確定性。

生產環境閉合邊界不一

不同的生產任務都有與之對應確定的生產環境,它們之間閉合的邊界是不一樣的。生產任務間切換的可能性是開放、近乎無限的,這就要求足夠高的智慧水平或在少量人類幫助下,完成這種環境的切換和適應。

標準產品具有標準智慧

標準產品具有一定水平的標準智慧,使得它在被部署到具體的生產場景時,可以較低的時間、人力成本學會具體的生產任務,盡可能適用不同的生產場景,使大規模套用成為可能。

EIIR 的模樣:具象化的具身智慧

如果對 EIIR 的本質沒有太多的疑問,不妨想象一下 EIIR 的模樣。具身智慧理論認為智慧體由感知系統、運動系統和世界模型三部份組成,這個論述對於 EIIR 仍然適用。為了更好的說明,我們以微億智造的技術探索實踐為例,進一步展開探討。微億智造作為工業 AI 領域先行者,長期布局「視覺 AI+機器人智慧控制」全棧技術,深耕工業場景,持續技術創新。

感知系統——多模態泛傳感器系統

透過合理選型、配置,輔以高效智慧的數據演算法,建立起比人類強大得多的感知系統,無論是周邊環境還是 EIIR 自身,都將進行連續、不間斷的狀態感知,為決策提供精準的資訊。如在工業檢測中挑戰最大的外觀缺陷檢測領域,微億智造樹立了機器感知的典範:辨識和分析物件姿態和特征,自主生成檢測序列,以高精度的影像傳感器來追蹤形態不定、位置不定的缺陷,實作柔性的、超越人類的缺陷檢測能力。並在此基礎上,基於動力學原理進行建模,透過資訊反饋「認知」自身能力,並即時更新。

透過「感知系統」對環境及自身持續采樣,並基於聯合認知進行決策

運動系統——閉環控制系統

打通、融合上下層系統,實作狀態反饋和控制的聯合處理、合並計算,共同最佳化、協作以滿足靈活、精準、快速的要求。以「關節電機」為例,其「視覺伺服」系統由多個控制器、按層級巢狀組合而成,每一層都有自身需要最佳化的控制指標與物件。從整體到局部逐層細化,實作閉環控制。比如微億智造自研的整套多軸即時控制系統,結合動力學和運動學演算法,計算時間和狀態最優的運動軌跡,並以毫秒級速度閉環運動控制,以 10 毫秒級別的速度使用影像模型完成閉環運動的規劃。

透過「視覺伺服」實作感知系統與運動系統的閉環控制

世界模型——對生產環境的總結和抽象

世界模型是智慧體根據自身結構特點構建起來、用於解釋世界的認知框架。它是動態變化的,智慧體與環境的每一次互動都在不同程度上影響著它。而大模型技術結合工業數據又為世界模型提供了一個共享的基礎版本,故且稱之為「基礎世界模型」。當然,這個「基礎世界模型」賦予了 EIIR 強大的理解能力,能夠透過人類習慣的模式與人類進行資訊交換。而人類訓練 EIIR 的方式也發生了根本性變化,只需透過自然語言、圖片、視訊、動作示教等,就可與 EIIR 建立起「示教-學習-反饋」的互動模式,透過多輪對話將知識進行傳遞。這樣的持續學習會一直貫穿在 EIIR 整個生命周期裏。

透過「基礎世界模型」建立「示教-學習-反饋」的互動模式

EIIR 的關鍵:智慧化柔性適配

如何讓標準、通用的 EIIR 產品很快具備執行具體生產任務的能力,或者如何把人類的專業技能輕便地轉移到 EIIR 上,核心在於透過「人機互動」實作「智慧化柔性適配」。以 ChatGPT 為例,它第一次在人和機器之間建立起了一種高效的溝通方式,從根本上打破了人機交流的障礙,變革了人機互動範式。

而大模型加持下的 EIIR 將徹底逆轉人機關系。人類可以用自身習慣的方式與 EIIR 溝通,如自然語言、肢體語言、動作、行為示範等,從根本上打破人與機器間的語意隔離。軟體方面,大模型的加持使得 EIIR 具備了快速學習的能力,保證了智慧上的柔性。隨著芯片技術的發展,軟硬體的功能邊界將變得模糊,「軟體硬化」的趨勢將會越來越明顯。伴隨更強大的運算能力及整合密度,EIIR 的算力密度也將實作質的提升。機械構型方面,新材料、新技術的廣泛套用將為 EIIR 提供更多不同的外部形態,甚至根據任務的要求即時調整機械結構。這種能力最忠實地還原了具身智慧理論的根本要求,實作了智慧和機體最深程度的融合。

03 EIIR,未來已來

EIIR 的誕生和歷史使命就是接管人類社會物質資料的生產,為人類的發展提供持續的物質支持,這也是它唯一的歷史歸宿。作為機器,隨著技術的進步,EIIR 的發展勢必將循序漸進。前期階段,它將長期和人類共處在同一生產環境下。伴隨技術的發展,其智慧化程度會越來越高,越來越多時候將不需要與人協作就可獨立完成任務。而發展的高級階段,將會實作真正的「無人工廠」。

到這個階段,工廠、產線的組織形式將完全不同於現在,而人類也將實作從使之異化的物質生產中徹底解放出來。這對人類社會的發展所起的作用是無法估量的,將極大加快人類自我解放的步伐。誠然,這會是一個漫長的過程,但值得我們期待,值得我們努力,因為它終將到來!