谷歌 DeepMind 捅破 AI 數學推理上限：6 道國際奧數題解出 4 道

2024-07-26科技

IT 之家 7 月 26 日訊息，谷歌 DeepMind 團隊昨日（7 月 25 日）釋出博文，表示其研發的 AlphaProof 和 AlphaGeometry 2 模型可以解決數學中的高級推理問題，在解答國際數學奧林匹克競賽難題方面達到銀牌標準。

AI 模型簡介

AlphaProof：基於強化學習的全新數學形式推理系統。

AlphaGeometry 2：幾何解題系統的改進版。

DeepMind 團隊結合兩個 AI 模型，協作解決了今年國際數學奧林匹克（IMO）6 道題目中的 4 道，首次在競賽中取得與銀牌得主同等的成績。

評分團隊

DeepMind 團隊兩位專家，根據 IMO 的評分規則進行評分，這兩位專家分別為：

蒂莫西高爾斯教授（Prof Sir Timothy Gowers）：著名數學家、IMO 金牌得主和費爾茲獎得主。

約瑟夫-邁斯博士（Dr Joseph Myers）：兩屆 IMO 金牌得主、IMO 2024 年問題遴選委員會主席

AI 模型推理

AI 會將 IMO 的 6 道題目轉譯成為模型可以理解的數學語言。

AlphaProof 透過確定答案並證明其正確性，解決了兩個代數問題和一個數論問題，而其中解決的 1 個問題是比賽中最難的，在今年的 IMO 中只有 5 位選手解決了這一問題。

AlphaGeometry 2 證明了幾何問題，沒有解決 2 個組合問題。

AI 模型結果

按照 IMO 規則，6 道題目每道題可獲得 7 分，總分最高為 42 分。

DeepMind 系統最終獲得了 28 分，每個問題都得到了滿分，相當於銀牌組的最高分。

2024 年的金獎門檻從 29 分開始，在正式比賽中，609 名參賽者中有 58 人獲得了金獎。

IT 之家附上參考地址