當前位置: 華文世界 > 科技

科學家嘗試培養AI持續學習能力

2024-08-23科技
參考訊息網8月23日報道據英國【新科學家】周刊網站8月21日報道,支持聊天生成預訓練轉換器(ChatGPT)等人工智慧(AI)系統的演算法無法邊工作邊學習,這迫使科技公司不得不花費數十億美元從頭開始訓練新模型。盡管這是業界一直關註的問題,但一項新研究表明,模型的設計方式存在固有問題,不過也許有辦法解決它。
目前,大多數人工智慧都是所謂的「神經網路」,其靈感來源於大腦的工作原理。人工智慧「神經網路」的處理單元被稱為「人工神經元」。它們在開發過程中通常會經歷不同的階段。首先,開發者對人工智慧進行訓練,透過演算法對人工神經元進行微調,以更好地反映給定的數據集。然後,人工智慧可被用於應對新數據,比如輸入ChatGPT的文本。不過,一旦模型的神經元在訓練階段就被設定好,它們就無法更新並利用新數據進行學習。
這意味著,如果有了新數據,大多數大型人工智慧模型都必須重新接受訓練,而這一過程可能非常昂貴,尤其是當這些新數據集由整個互聯網的大部份數據組成時。
研究人員一直想知道,這些模型能否在接受初始訓練後吸收新知識,從而降低成本,但一直不清楚它們能否做到這一點。
現在,加拿大艾爾伯塔大學的希班什·杜哈雷和他的同事測試了最常見的人工智慧模型能否適應持續學習。研究團隊發現,它們很快就失去了學習新知識的能力,大量的人工神經元在接觸到新數據後就會停留在零值上。
杜哈雷說:「如果你把它想象成你的大腦,那麽一旦90%的神經元都死了,剩下的就不夠你學習時用了。」
杜哈雷及其團隊首先利用ImageNet資料庫訓練人工智慧系統。該資料庫由1400萬張帶有標簽的房屋或貓等簡單物體的影像組成。但他們並沒有按照標準行事(即訓練人工智慧一次,然後透過讓其多次嘗試區分兩幅影像來測試它),而是在區分每對影像之後重新訓練模型。
他們用這種方法測試了一系列不同的學習演算法,發現經過幾千次的再訓練後,這些網路似乎無法學習且表現很差,許多神經元似乎「死了」,即值為零。
研究團隊還透過強化學習來訓練人工智慧,讓其模擬螞蟻如何學習行走。強化學習是一種常見方法,它教給人工智慧成功是什麽樣子,並透過試錯找出規律。他們試著調整這種技術以實作持續學習,具體方式是,每換一種表面供螞蟻行走,就重新訓練演算法。之後他們發現,這也會導致人工智慧明顯喪失學習能力。
杜哈雷說,這個問題似乎是這些系統的學習方式所固有的,但有一種方法可以解決問題。研究人員開發了一種演算法,在每輪訓練後隨機啟用一些神經元,這似乎減少了表現不佳的情況。
杜哈雷說:「如果一個(神經元)已經死了,那麽我們只需讓它復活。現在它又能學習了。」
英國牛津大學的馬克·範德維爾克說,這種演算法看起來很有前途,但還需要在更大的系統中進行測試,才能確定它是否有用。
他說:「持續學習問題的解決方案是一個價值數十億美元的重大問題。一個真正全面的解決方案可以讓你不斷更新模型,這將大大降低訓練這些模型的成本。」(編譯/劉白雲)