當前位置: 華文世界 > 科技

AI也偏科:語文很厲害,但數學不行!

2024-07-24科技

在過去的一年裏,人工智能(AI)領域取得了令人矚目的進展,尤其是在語言處理和生成方面。像OpenAI的ChatGPT這樣的AI聊天機器人展示了強大的語言能力,能夠撰寫詩歌、總結書籍並回答各種問題。然而,這些智能系統在數學領域表現出的不足也引發了廣泛的討論和關註。盡管AI在許多方面展示了超人的能力,但其在數學方面的表現卻不盡如人意,這揭示了當前AI技術的局限性和未來的發展方向。

當前的AI聊天機器人,如ChatGPT,展現了令人驚嘆的語言處理能力。它們可以根據海量的訓練數據生成連貫且具有深度的文本,模仿人類的交流方式。然而,當涉及到數學問題時,這些系統常常顯得力不從心。雖然AI可以根據所學知識進行數學運算,但由於其主要依賴概率而非規則計算,結果往往不準確。

正如西北大學電腦科學教授兼人工智能研究員基斯頓·哈蒙德(Kristian Hammond)所言,AI聊天機器人在數學方面表現不佳,因為它們從未被設計為數學專家。AI的基礎技術是透過分析大量數據進行學習,而非透過嚴格的規則編程。這種方法在語言處理上取得了巨大成功,但在數學上則表現出明顯的局限性。

回顧電腦科學的發展歷史,傳統電腦被編程為遵循嚴格的規則和結構化數據庫,以進行快速、準確的計算。在20世紀40年代早期,計算的主要目標是強化數學能力,電腦成為了不知疲倦的數碼處理機器。然而,這種基於規則的編程方式也導致了電腦系統的脆弱性,尤其在處理復雜和多變的任務時。

十多年前,神經網絡技術的突破改變了這一局面。神經網絡大致模仿人類大腦,透過分析大量數據進行學習,不再依賴嚴格的規則。這種技術在語言處理上表現出了卓越的能力,但在數學推理和套用題上仍存在不足。AI聊天機器人在面對需要多個步驟才能解決的簡單算術問題時,常常出錯,表現不穩定

盡管AI在數學方面的表現欠佳,但教育領域仍在積極探索其套用潛力。Khan Academy首席學習官Kristen DiCerbo在一次研討會上提到,數學準確性是AI在教育中的一個重要問題。Khan Academy正在試驗AI聊天機器人作為導師和教學助理,並對其AI系統Khanmigo進行了調整,將許多數學問題發送給小算盤程式處理,以提高準確性。

OpenAI也在持續改進其AI系統在數學方面的表現。根據OpenAI的聲明,數學是一個「重要的持續研究領域」,其科學家們在這一領域取得了穩步進展。最新版本的GPT在一個包含數千個需要視覺感知和數學推理的問題數據庫中實作了近64%的準確率,高於之前版本的58%。這種進步顯示出AI在數學領域的潛力,但距離真正的精確計算還有很長的路要走。

AI在數學上的不足引發了關於該領域最佳發展方向的激烈辯論。當前,存在兩種主要觀點。一方面,有人認為先進的神經網絡和大型語言模型是實作通用人工智能(AGI)的唯一途徑。AGI是指能夠完成任何人類大腦能完成的任務的電腦,這一觀點在矽谷得到了廣泛支持。

另一方面,懷疑者如Meta首席人工智能科學家Yann LeCun認為,僅僅增加數據和計算能力不足以解決AI的所有問題。他提出了一種更廣泛的方法,稱之為「世界建模」,即開發能夠像人類一樣理解世界運作方式的系統。這種方法可能需要十年的時間才能實作,但被認為是更為全面和長遠的解決方案。

盡管AI在數學上的表現存在不足,但在實際套用中仍展示了巨大的潛力。例如,Meta正在其社交媒體服務中整合AI助手軟件,利用其大型語言模型LLaMA。這些助手雖然在邏輯和常識推理上存在缺陷,但在處理日常任務和提供使用者支持方面表現出色。

David Ferrucci領導的團隊開發了著名的IBM Watson電腦,該電腦在2011年擊敗了人類「危險邊緣!」選手。Ferrucci博士的初創公司Elemental Cognition正在開發使用大型語言模型和基於規則的軟件,以改善金融、旅遊和藥物研發等領域的決策。這種結合了結構化軟件和語言模型的方法展示了AI在商業套用中的前景。

紐約高中數學老師Kirk Schneider認為,AI聊天機器人進入教育領域是不可避免的。他指出,盡管學校可能試圖禁止AI的使用,但學生們仍會找到使用它們的方法。Schneider先生認為,AI的偶爾失誤反而可以成為教育的機會,幫助學生發展批判性思維。

在課堂上,Schneider先生經常將學生分成小組,讓他們比較自己的答案和AI的答案。這種方法不僅培養了學生的數學能力,還教會他們用批判的眼光看待AI生成的資訊。這是一種重要的技能,即使在未來AI技術不斷進步的情況下,學生們仍需要保持獨立思考和判斷的能力。

人工智能在語言處理上的卓越表現與其在數學上的不足形成了鮮明對比。這種對比揭示了當前AI技術的局限性,同時也指明了未來的發展方向。隨著AI技術的不斷進步,我們有理由相信其在數學領域的表現會逐步改善。