當前位置: 華文世界 > 科技

谷歌 DeepMind 捅破 AI 數學推理上限:6 道國際奧數題解出 4 道

2024-07-26科技

IT 之家 7 月 26 日訊息,谷歌 DeepMind 團隊昨日(7 月 25 日)釋出博文,表示其研發的 AlphaProof 和 AlphaGeometry 2 模型可以解決數學中的高級推理問題,在解答國際數學奧林匹克競賽難題方面達到銀牌標準。

AI 模型簡介

  • AlphaProof:基於強化學習的全新數學形式推理系統。

  • AlphaGeometry 2:幾何解題系統的改進版。

  • DeepMind 團隊結合兩個 AI 模型,協作解決了今年國際數學奧林匹克(IMO)6 道題目中的 4 道,首次在競賽中取得與銀牌得主同等的成績。

    評分團隊

    DeepMind 團隊兩位專家,根據 IMO 的評分規則進行評分,這兩位專家分別為:

  • 蒂莫西高爾斯教授(Prof Sir Timothy Gowers):著名數學家、IMO 金牌得主和費爾茲獎得主。

  • 約瑟夫-邁斯博士(Dr Joseph Myers):兩屆 IMO 金牌得主、IMO 2024 年問題遴選委員會主席

  • AI 模型推理

    AI 會將 IMO 的 6 道題目轉譯成為模型可以理解的數學語言。

    AlphaProof 透過確定答案並證明其正確性,解決了兩個代數問題和一個數論問題,而其中解決的 1 個問題是比賽中最難的,在今年的 IMO 中只有 5 位選手解決了這一問題。

    AlphaGeometry 2 證明了幾何問題,沒有解決 2 個組合問題。

    AI 模型結果

    按照 IMO 規則,6 道題目每道題可獲得 7 分,總分最高為 42 分。

    DeepMind 系統最終獲得了 28 分,每個問題都得到了滿分,相當於銀牌組的最高分。

    2024 年的金獎門檻從 29 分開始,在正式比賽中,609 名參賽者中有 58 人獲得了金獎。

    IT 之家附上參考地址