當前位置: 華文世界 > 科技

蘋果開發出新款AI:可「看懂」螢幕內容並語音回復

2024-04-02科技

快科技4月2日訊息,據媒體報道,蘋果公司近日宣布,成功研發出一款前沿的人工智能系統——ReALM(Reference Resolution As Language Modeling,即基於語言建模的參考解析)。

據悉,該系統具備卓越能力,能夠精準解析螢幕上模糊的內容,同時深入理解相關對話及背景環境,從而為使用者提供更為自然流暢的語音助手互動體驗。

ReALM系統透過運用大語言模型技術,巧妙地將辨識螢幕視覺元素這一復雜任務轉化為純語言處理問題。這一創新轉換使得ReALM在效能上相較於傳統技術實作了質的飛躍。

值得一提的是,ReALM的獨特之處在於其能夠重新構建螢幕內容。透過深入分析螢幕上的資訊及其位置分布,系統能夠生成精準的文本表示,這對於捕捉視覺布局中的關鍵資訊至關重要。

研究人員進一步展示了將ReALM與專門針對內容指向最佳化的語言模型相結合的方法,結果顯示在執行相關任務時,ReALM的效能已超越業界翹楚GPT-4。

研究人員興奮地表示:「我們對現有系統進行了深度最佳化和顯著改進,使其在處理各種類別的內容指向任務時均表現出卓越效能。即便是我們的最小模型,也實作了超過5%的效能提升;而大型模型的表現更是顯著超越GPT-4,令人矚目。」

長期以來,蘋果在創新領域更多扮演跟隨者的角色,然而隨著人工智能技術的迅猛發展,市場格局正發生深刻變革。如今,蘋果正積極迎接挑戰,努力在人工智能領域占據一席之地。

此外,備受矚目的全球開發者大會即將在6月盛大召開。屆時,蘋果預計將推出一系列創新成果,包括全新大語言模型框架、「Apple GPT」聊天機器人及其生態系中的其他AI功能。