隨著人工智慧技術的不斷進步,我們已經從早期的生成式AI(Generative AI)逐步邁向了更加智慧、自主的Agentic AI時代。這一新興技術不僅在消費領域展現了巨大潛力,更在企業套用中顯示出其獨特的價值。那麽,Agentic AI究竟是什麽?它如何改變我們的工作和生活方式?本文將深入探討Agentic AI的定義、核心要素以及在各行各業的套用前景,帶領讀者一探究竟。
早期階段的生成式人工智慧,抑或「請求/響應式 AI」,未能達到炒作所營造的預期水平。智慧代理人工智慧(Agentic AI)作為人工智慧的下一個層級,建立在生成式人工智慧的基礎之上,將為企業帶來更具實效的商業價值。
Agentic AI 的概念可以追溯到上世紀 90年代 IBM 深藍象棋系統出現之時,但其再次受到關註得益於大語言模型的套用。尤其是 AI Agent 和 Autonomous Agent 的具體套用,讓 Agentic AI 再次被熱議,包含 AI Agent 的工作流更是讓 Agentic AI 成為 AI 領域的熱門話題。
目前,有關 Agentic AI 的研討主要聚焦於消費套用領域,比如一個代理充當人類的數位助手。然而,在消費環境中,數位助手是一個開放且復雜的難題。相反,Agentic AI 在企業用例方面展現出更大的潛力,原因在於企業中的任務相對更規範,存在清晰的流程用以引導代理。
本文全面分享了對於 Agentic AI 新興趨勢的觀點,包括如何定義,明確要將其變為現實所欠缺的要素以及列舉該領域的部份參與者。
一、Gen AI
去年 1 月,風投機構 A16z 對新興的 Gen AI 技術棧進行了描述,其基本上呈現出了請求-響應模型。即透過自然語言發起請求,再借助檢索增強生成(RAG)管道來存取數據並返回答案。
這個過程雖然極為迅速,但答案往往差強人意,並且相同或相似的查詢常常會給出不同的答案。所以,這種模式給企業客戶帶來的投資報酬較為有限。當然,也存在一些出色的套用例項,諸如程式碼輔助、客戶服務、內容創作等等。而 Agentic AI 則是在 Gen AI 基礎之上構建。
假如把企業看成一座城市,在這個城市中,Agent 要想代替使用者去執行工作,關鍵在於理清如何導航才能完成工作。
也就是說,Agent 就像一個「跑腿小哥」,需要一張地圖和相應交通工具來完成客戶(也就是 Agent 使用者)的單子,Agent 需要知道從哪裏拿貨,送到哪裏以及哪條路最近。
這正是企業的優勢,因為大部份工作都具有有限且合理、明確界定的路線和任務,使得企業中 Agent 能夠更為迅速地完成更具價值的工作。
二、Agentic AI 的定義
在【Practices for Governing Agentic AI Systems】白皮書中, OpenAI 認為 Agentic AI systems(智慧體人工智慧系統)的特征是能夠采取行動,這些行動在很長一段時間內持續地有助於實作目標,而不必事先明確規定其行為。artificiality 將 Agentic AI Systems 定義為能夠以不同復雜性感知、推理和行動的系統,以將人類思維擴充套件到我們當前經驗之外。該定義更加強調了感知、推理和行動這三種能力。
結合來看,Agentic AI 是指被設計用來透過理解目標、導航復雜環境,並在最少的人工幹預下執行任務的系統,能夠透過自然語言輸入獨立和主動地完成端到端任務。
不難看出,與傳統 AI 的區別是 Agentic AI 具有自主性、主動性和獨立行動的能力。這一點與 AI Agent 相似,但與 AI Agent 的區別在於 AI Agent 更側重於作為一個明確的主體存在,能夠完成特定的任務,但相對來說自主性和適應力可能較為有限。而 Agentic AI 則在自主性和適應力上表現更為突出,能夠在復雜環境中更靈活地應對變化,並作出更具主動性的決策,AI Agent 則需要更多的人工幹預和重新編程來適應變化。
三、供應鏈中的 Agentic AI 範例
亞馬遜每周會對 4 億個庫存單位的銷售情況進行預測,並展望未來五年的發展態勢。之所以需要進行如此長遠的展望,是因為它擁有不同的代理,而這些代理會依據時間範圍和所需協調的工作型別去執行不同的任務。
例如,一個負責長期規劃的代理或許會計算出需要建設多少配送中心容量。另一個代理可能會對每個現有或尚未建成的配送中心的布局進行配置,還有一個代理可能會算出在下一個交付周期中每個供應商每個庫存單位的訂購數量。再有一個代理會計算出貨物到達時如何進行交叉裝卸,以確保庫存能夠分配到正確的位置。隨後,在收到客戶訂單後,又會有一個代理必須計算出工人應當如何揀選、包裝和發貨該訂單的物品。
這些代理需要為了一些總體的企業目標(比如盈利能力)來協調各自的計劃,並且要受到滿足亞馬遜所設定的交付時間目標的限制。重要的是,一個代理有關配送中心配置(例如)的決策必須告知另一個代理如何揀選、包裝和發貨訂單。
換句話說,每個代理所做的分析都必須為其他所有代理的分析提供資訊。所以,這不單單是搞清楚一個代理的工作內容,而是要協調眾多代理的工作和計劃,並考慮它們之間的相互依賴關系。
代理依照人類設定的目標開展工作。生成的計劃送出給人類進行審查,然後根據實際需要付諸實施或者進行修訂和最佳化。正是人類的直覺與機器的效率相互結合,才使得這一過程變得如此強大。
四、Agentic AI 在各行業的擴充套件
當下的工具,主要是針對自然語言請求給出一個答案。想象一下,如果將亞馬遜各種代理協作的案例轉化為一種軟體能力,讓所有企業都能夠借助它來建立代理系統。
就像前面提到的,如果在 A16z 的技術棧基礎上做一些編排框的補充,模型將透過呼叫應用程式並利用這些應用程式中的多個工作流來執行更多的編排工作。
在圖表中形似 L 形的空框裏,展示了數位世界與物理世界的融合,就像是「語意層」,為數據賦予明確、一致且可理解的語意,使得不同的系統、應用程式和使用者能夠以統一的方式理解和處理數據,而不會因為數據的表示方式或來源的不同而產生歧義。進一步來講,在標有「API 和外掛程式」的框周邊的虛線部份,這些操作從呼叫工具轉變為能夠呼叫遺留操作應用程式或分析模型的操作,該操作本質上屬於工作流構建塊。
在操作方面,一項工作或者一個分析模型,或許是「告訴我業務中應該發生什麽或已經發生了什麽,進而得出接下來應該發生什麽」。這些本質上是把工具提升為操作。在大型語言模型的表述裏,這些變成了動詞。
回到中間的編排器:如今,大多數透過大型語言模型完成的工作流編排來源於程式設計師在程式碼中所指定的內容。在未來,大型語言模型將成為大型動作模型(LLM→LAM),並生成操作計劃或工作流。
要實作這一點,它需要對 RAG 管道通常檢視的原始數據進行升級,從而建立業務的數位表征。這就是地圖或者知識圖譜,上面寫著:「企業中的人員、地點和事物以及連線它們的活動是什麽?」這讓代理能夠弄明白如何導航以達成其目標。
以亞馬遜為例,代理需要了解預測中的內容,以知曉不同庫存計畫與哪些供應商相關,這些供應商能夠生產什麽,以及物流如何在何處交付其產出。
五、機器人流程自動化(RPA)的作用
在這一方面,可以把 RPA 視作一個管道系統,它能夠輔助采用連線至螢幕或者應用程式編程介面(API)的軟體機器人。而透過 Agentic AI ,大型語言模型(LLM)能夠學會導航螢幕,或者在有可用的 API 時學會使用,又或者透過觀察來進行學習。
關鍵之處在於,當下眾多的 RPA 都是運用了寫死指令碼,基於已知的規則執行任務。因此,需要一個更為強大的自動化環境,當這些寫死指令碼轉變為智慧代理時,其對變化的適應能力會更強。而 Gen AI 能夠助力讓構建管道變得更為容易且不那麽繁雜,在國內,有阿裏巴巴、字節跳動、實在智慧等 AI 企業在這一領域探索,並取得了一定效果。
比如,在 2024 世界人工智慧大會(WAIC 2024)亮相的「文生數位員工」實在 Agent 受到了業界關註。實在 Agent 以實在智慧自有 TARS 大模型為「腦」、ISSUT(智慧螢幕語意理解技術)為「眼」,IPA (智慧流程自動化)為「手腳」,可以理解人類提出的任務需求,自主理解PC環境、規劃流程並執行完成任務,實作「你說 PC做,所說即所得」和「文生數位員工」的理想套用效果。
在國外,推動 Agentic AI 發展的代表性公司有:OpenAI,作為關鍵的大型語言模型參與者——在帳戶滲透率方面遙遙領先;UiPath Inc.、Celonis 和 ServiceNow Inc. 在自動化領域,以及像 Palantir、Snowflake Inc. 和 Databricks Inc. 等分析和數據平台公司。
六、達成 Agentic AI 欠缺哪些元素
總結來看,當今的大型語言模型正在從能夠透過自然語言查詢檢索數據的模型轉變為能夠編排工作流的大型動作模型(LAMs)。要切實利用 Agentic AI,必須與遺留應用程式相連線,並且必須協調這些應用程式中的數據。
聽起來簡單,但能夠近乎即時地理解並采取行動是業務的 Agentic AI 需要以持續的方式構建和訓練代理的工具鏈。以下是幾個關鍵要素:
- 強大的數據基礎:包括高品質、大規模且多樣化的數據,以便模型能夠進行有效的學習和推理。
- 先進的演算法和模型架構:如深度學習中的神經網路架構,能夠處理復雜的任務和關系。
- 高效的計算資源:用於訓練和執行復雜的模型,以確保快速的處理和響應。
- 對業務流程和使用者需求的深刻理解:以便準確地定義代理的任務和目標。
- 良好的互動設計:使得使用者能夠自然、便捷地與代理進行溝通和互動。
- 持續的學習和最佳化機制:以適應不斷變化的環境和需求。
- 安全和私密保護措施:確保數據的安全性和使用者私密不受侵犯。
- 跨領域的專業知識融合:如電腦科學、統計學、業務領域知識等,以構建全面有效的解決方案。
當然,具體的需求可能因套用場景和業務目標的不同而有所差異。
本文由 @阿木聊AI(智慧體) 原創釋出於人人都是產品經理。未經作者授權,禁止轉載
題圖來自Unsplash,基於CC0協定
該文觀點僅代表作者本人,人人都是產品經理平台僅提供資訊儲存空間服務