當前位置: 華文世界 > 遊戲

不如真人?AI大戰【黑神話悟空】Boss,廣智虐人機千遍

2024-09-27遊戲

【黑神話:悟空】上線這一個多月以來,通關率已經來到了37.8%。這個數碼在動作遊戲中,已經是相當誇張的了。許多原本並不擅長這一玩法類別的玩家,為了情懷都堅持通關,中間耗費了大量練習成本。平均通關時長,來到了近60個小時。

對於那些實在打不過各路妖王的玩家來說,投入風靈月影宗也不是什麽丟人的事情。可有沒有一種可能,不用人來操作就擊敗敵人呢?答案是肯定的。自遊戲釋出後,就有不少人進行了使用AI玩【黑神話:悟空】嘗試,並取得了一定的成果。

近期,阿裏巴巴的研究人員們提出了一個新型VARP(視覺動作角色扮演)智能體框架。透過將遊戲截圖作為輸入,透過視覺語言模型推理,最終生成Python程式碼形式的動作,以此來操作遊戲。

依靠著對遊戲中輕攻擊、重攻擊、閃避、回血等幾個基本操作,融入到原子命令的序列中,AI操作的天命人能夠真正做到自主探索。在面對第一章黑風山的小怪和精英怪時,AI都能做到遊刃有余。較之真人玩家的整體數據,AI的勝率甚至還要更高些。

不過因為遊戲截圖作為輸入的局限性,當面對攻擊手段多、技能特效華麗的Boss敵人時,VARP智能體框架就沒那麽好用了。這時候,就需要借助其他技術手段。

早在遊戲發售首周,其實就已經有人透過AI技術,戰勝過虎先鋒了。B站UP主「AI研究室-帆哥」透過「強化學習」對AI進行訓練,以求能對虎先鋒的攻擊進行規避和反擊。

所謂「強化學習」的原理,跟許多動物實驗類似。就是在動物完成特定指令時,給予獎勵。當然,AI所需要的獎勵只是一串程式碼。只需要設定體力值上升獎勵(鼓勵完美閃避)、敵人掉血獎勵(鼓勵擊殺)、自身血量下降扣分(鼓勵防守)等方式,AI就會自行戰鬥。

AI將對敵人的行為做出反饋,在經過上述幾點訓練內容的學習,AI最終成功戰勝了虎先鋒。

考慮到這種做法中間耗費的訓練時間太長,後續UP主又調整了AI訓練的方向。畢竟,動作遊戲的基本邏輯就是盡可能躲避對方攻擊,並找機會攻擊對方。透過對螢幕內資訊的采集,再載入面對這些動作時該如何應對的樣本,一種耗時更短的AI模型就誕生了。

當AI檢測到敵人的攻擊動作時,就會做出閃避動作。當敵人不攻擊時,AI又會主動上去攻擊。靠著這個AI模型,折磨了無數新人的幽魂也倒在了天命人的棍下。但美中不足的是,這個AI不會控制體力,往往會做出無意義的翻滾,同時也不會用技能。

截止到目前,表現地最自然、最具操作的【黑神話:悟空】AI,當屬UP主「圖靈的貓」制作的模型。他將上述提到的幾大邏輯結合在了一起,既檢測敵人的動作、又對AI進行引導學習、還時刻提醒天命人註意自身血量回血。

攻擊方式也不再一成不變,除了使用定身法、重棍攻擊外,做出閃避和放緩節奏回復體力條,都不在話下。當然啦,這麽做的代價就是長時間的練習成本。光是擊敗廣智,這個AI就死了上千次。

相較於真人玩家的操作,現在的AI還是有所欠缺的。因為不論是Boss的攻擊手段還是天命人自身的攻擊手段都多到爆表。或許有朝一日,AI能夠練到「逢攻擊必識破」、「凡閃避必完美」的地步,但想像真人玩家那般打得流暢、打得漂亮,還有很長一段路要走。

不知道大家在體驗【黑神話:悟空】時,在哪個Boss身上花費的練習成本最高呢?