GPT-4o 打【黑神話·悟空】！AI「馬嘍」拿捏 Boss，勝率超人類

2024-09-29遊戲

【黑神話·悟空】這個遊戲就一個怪嗎？

我承認，當朋友對我發出這樣的質疑時，那一刻，我破防了。

從意識到必拿下楊戩，到必撐死虎先鋒，我只花了不到半天的時間，而如果想通關【黑神話】，我們能夠指望 AI 嗎？

翻滾閃避，拉開距離，精怪的行動盡收眼底。

時機一到，天命人猛地揮出重棍。

借助 AI 的力量，一套絲滑連招下來，Boss 被拿捏得毫無還手之力，不知饞哭多少遊戲手殘黨。

阿裏研究團隊最近提出了一個 VARP 智能體框架。而這個 AI「馬嘍」正是出自他們之手。

可以說，不是外掛，卻勝似外掛。

直面大聖的 GPT 們，還真不比人類差

AI 直面大聖，其實也沒那麽復雜。

傳統上，遊戲 AI 靠的是遊戲 API 來獲取環境資訊和可執行的動作數據。但問題是，並不是每個遊戲都願意提供開放的 API，或者即使提供，有的 API 也缺胳膊少腿，很難滿足實際需求。

而且，傳統方法也總感覺少點什麽，無法完全模擬人類玩家的真實遊戲體驗。

基於此，阿裏研究團隊提出了一個新的 VARP（Vision Action Role-Playing）智能體框架。

VARP 智能體框架在接收輸入的遊戲螢幕截圖後，透過運用一組 VLMs 進行推理，最終生成 Python 形式的程式碼來操控遊戲角色，包括一系列原子命令的組合，如輕攻擊、躲避、重攻擊和回血等。

VARP 包含三個知識庫：情境庫、動作庫和人類引導庫，以及兩個系統：動作規劃系統和人類引導軌跡系統。

簡單來說，動作規劃系統相當於圖書館管理員，負責從情境庫和可更新的動作庫中找出最合適的資料。

系統根據輸入的遊戲螢幕截圖，挑選或生成符合當前情境的動作，然後這些動作和情境會被存入或更新到這兩個庫中。

而人類引導軌跡系統則利用人類運算元據集來提升 VARP 在復雜任務中的表現，比如尋路任務和高難度戰鬥任務等。

在動作庫中，「def new_func_a()」表示由動作規劃系統生成的新動作，而「def new_func_h()」表示由人類引導軌跡系統生成的新動作。「def pre_func()」表示預定義的動作。

在上文提到的【黑神話·悟空】遊戲中，研究團隊設定了 12 個任務，其中 75% 涉及戰鬥，並使用包括 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 pro 等 VLMs 進行了基準測試。

結果顯示，VARP 在基本任務和簡單到中等難度的戰鬥中，勝率高達 90 %。但在面對高難度任務時，VARP 的表現容易掉鏈子，整體水平仍然不如人類玩家。

此外，VARP 智能體在處理遊戲中的決策時，因為依賴於視覺語言模型（VLM）的推理速度，所以不能夠即時地分析每一個遊戲幀（即遊戲畫面）。

換句話說，它不能像人類玩家那樣，幾乎瞬間對螢幕上發生的一切作出反應。相反，它只能每隔幾秒鐘處理一次遊戲畫面，選擇一些重要的幀（關鍵幀）來進行分析和決策。

【黑神話·悟空】上線時曾被吐槽沒有明確的地圖，且存在大量的「空氣墻」，所以在沒有研究人員的輔助下，AI 也會像無頭蒼蠅一樣找不到 Boss。

生成式 AI 點燃了世界變革的火種，而在它尚未湧入大眾視野之時，普通人對 AI 更直觀的羈絆或許大多源於遊戲。

在電子遊戲史上，AI 遠比我們想象的重要

可能很多人都沒想到，最早一批搭上 AI 快車的遊戲會是經典街機遊戲【吃豆人】。

玩家勝利的前提是吃掉迷宮內的所有豆子，而哪些看似傻乎乎的彩色鬼魂則擁有不同的追擊演算法，它們會以不同的路徑和方式對玩家展開圍追堵截。

每個鬼魂的演算法招數異常簡單，也缺乏任何學習能力，一旦玩家摸透了這些規律，遊戲的挑戰難度便會直線下降。

1987 年推出的【合金裝備】則標誌著遊戲 AI 的另一個重要裏程碑。

遊戲中的 AI 角色開始展現出更為復雜的行為模式，並首次引入了對玩家的敵對反應機制。在這款遊戲中，如果玩家被敵人發現，敵人會觸發警報系統，呼叫增援，改變巡邏路線，甚至設定陷阱。

再後來，如果粗淺地將 AI 與遊戲的發展歷程用一連串標誌性事件羅列出來，大致如下：

1997，IBM 的「深藍」在國際象棋比賽中擊敗人類世界冠軍，標誌著 AI 在棋類遊戲中的重大突破。

2004 年，【半條命 2】釋出，遊戲中的 AI 角色能夠進行更復雜的決策和互動，提升了遊戲的沈浸感。

2011 年，IBM 的「沃森」在智力問答節目【危險邊緣】中擊敗了人類冠軍，展示了 AI 在自然語言處理和知識推理方面的進步。

2016 年，AlphaGo 在圍棋比賽中擊敗了李世石，標誌著 AI 在復雜策略遊戲中的重大突破。

2018 年，【荒野大鏢客 2】釋出，遊戲 AI 角色和環境互動水平大幅提高，提供了高度逼真的遊戲體驗。

2020 年，輝達推出了 DLSS 技術，利用 AI 加速圖形渲染，提升了遊戲的效能和畫質。

置於當下的遊戲環境中審視，遊戲依然主打一個陪伴，而 AI 則如同一台放大器，將這份陪伴放大了無數倍。

在今年的 CES 展會上，輝達使用 Avatar Cloud Engine（ACE）讓遊戲 NPC「活」起來，也借此火爆出圈。

在名為 Kairos 的演示中，玩家能夠與拉面店老板 Jin 進行互動。雖然 Jin 只是一個 NPC，但在生成式 AI 的幫助下，像真人一樣回答問題。

AI 與遊戲的結合也總是讓人感到既愛又恨。

就拿競技類遊戲來說吧，過往的做法只是生硬地調整難度，而現在則是模仿人的操作，讓遊戲體驗更加真實。

支持者認為，當模擬人類的 AI 成為對手或隊友的時候，反過來也能提升因缺乏真人玩家所帶來的遊戲競技感。

而弊端也正在於此，玩家的的留存率是提高了，但在系統的操控下，玩家們也逃脫不了被 AI 玩弄的漩渦。

前期豪言壯語，中期胡言亂語，後期沈默不語。

當我們熬夜通宵只為再贏一把的時候，已經很難說清楚究竟是我們在玩這個遊戲，還是這個遊戲在玩我們。尤其當你意識到隊友可能是 AI 時，那種無力感就像是拳頭打在了棉花上。

心裏也軟綿綿的，毫無著力點。

老黃預言家！未來遊戲或將由 AI 生成？

即便是程式碼小白，也能用 AI 手搓遊戲。

這放在幾年前，估計只能在夢裏想想了，但生成式 AI 到來讓這一切有了落地的實際空間。

往小了說，建立一個 GPTs 玩起故事劇本殺，再大了點說，那就是 AI 輔助生成的小程式遊戲，雖然互動性差點意思，但勝在畫面精美豐富。

再往大了說，甚至未來連 3A 大作級別的遊戲，都有可能直接透過 AI 渲染生成。

去年輝達創始人黃仁勛曾預言，未來遊戲中的每一個像素都將被生成，而不是渲染。當時這話說的時候，但大家可能還半信半疑，但現在，越來越多的研究成果給這個落地找到了可能性。

通常，制作一款小型遊戲的環境可能需要一周時間，對於工作室專案，建立遊戲環境可能需要更長的時間，具體取決於設計的復雜程度。

上個月，Google DeepMind 公布了首個「AI 遊戲引擎」GameNGen。

它能夠在單個 TPU 芯片上以超過 20 幀每秒的速度即時模擬經典射擊遊戲【淪陷戰士】。其工作原理是利用擴散模型即時預測每一幀，這意味著，遊戲中的每一刻都是根據玩家的操作和環境的復雜互動即時生成的。

當時，輝達高級科學家 Jim Fan 不禁感慨，被黑客們在各種地方瘋狂執行的【淪陷戰士】，竟然在純粹的擴散模型中實作了，每個像素都是生成的。

再後來，類似更多成果也正在湧現。

前不久，騰訊也放了大招，推出了一款專門面向 3A 開放世界遊戲的大模型——GameGen-O。

GameGen-O 可不簡單，它能夠模擬各類 3A 遊戲，比如【巫師 3】、【賽博龐克 2077】【刺客信條】以及【黑神話：悟空】裏的角色、動態環境，以及復雜動作等，生成的遊戲場景質素也很高。

為了構建數據集，下血本的騰訊搜集了超過 32000 個遊戲影片，每個影片短則幾分鐘，長則幾小時，然後經過人工數據標註挑選了 15000 個可用影片。

這些精選的影片透過場景檢測被切割成片段，然後按照美學、光流分析和語意內容進行了嚴格的排序和過濾。

美國遊戲開發商 Electronic Arts 最近也透過一段「從想象到創造」影片，向業界展示了未來 AI 在遊戲開發落地的美好願景。

影片中，玩家僅憑簡單的指令，就能使用 AI 工具建立遊戲場景、角色和其他內容。

CEO Andrew Wilson 稱未來生成式 AI 可改進公司一半以上開發流程，預計將在三至五年內設計創造更大、更身臨其境的遊戲世界。

AI 不僅能夠提升現有遊戲的開發效率，還可能創造出全新的遊戲體驗。

也許你會說，不管遊戲用的是什麽高大上的技術，歸根結底，好玩才是王道。

但在 GTA 6 反復跳票，遲遲不見蹤影的情況下，我們或許也會萌生一種自己動手、豐衣足食的念頭。

畢竟，如果未來能親手打造一個「罪惡都市」，感覺好像也還不錯。

#歡迎關註愛範兒官方微信公眾號：愛範兒（微訊號：ifanr），更多精彩內容第一時間為您奉上。

愛範兒|原文連結·檢視評論·新浪微博