當前位置: 華文世界 > 科技

趕在Google I/O開發者大會公布AI 產品前夕,OpenAI釋出全能模型GPT-4o!速度提升200%,支持即時音影片互動

2024-05-14科技

新浪科技訊 5月14日上午訊息,趕在Google I/O開發者大會公布 AI 產品前夕,OpenAI又來搶風頭了。

台北時間5月14日淩晨,OpenAI在一則簡短的影片介紹中釋出了可即時進行音訊、視覺和文本推理的新一代AI模型GPT-4o,並將推出PC桌面版ChatGPT。

據介紹,GPT-4o裏的「o」是Omni的縮寫,也就是「全能」的意思。在API使用方面,相比去年11月釋出的GPT-4-turbo,GPT-4o價格下降50%,速度提升200%,未來幾周內GPT-4o語音和影片輸入功能也將隨之推出。

此外,OpenAI還宣布,GPT4-o與ChatGPT Plus會員版所有的能力,包括視覺、聯網、記憶、執行程式碼、GPT Store等,將對所有使用者免費開放!

釋出會上,OpenAI聯合創始人兼總裁格雷格·布羅克曼(Greg Brockman)還將舊版本只具備對話功能的ChatGPT,與基於GPT-4o釋出的具備視覺能力的新版ChatGPT進行了5分鐘的對話。

對話中,新版本ChatGPT不僅能透過視覺AI能力理解網絡攝影機中發生的事情,同時還能夠將理解的內容透過語音與舊版本ChatGPT互動,進行更加豐富有趣的互動。同時還支持中途打斷和對話插入,且具備上下文記憶能力。

對於此次釋出,OpenAI CEO山姆·奧爾特曼(Sam Altman)發即時推文表示,「新的GPT-4o模型是OpenAI有史以來最好的模型,它很智能,速度很快,是原生多模態,並且可供所有ChatGPT使用者使用,無論是免費版本還是付費GPT-4版。」

「這對我們的使命很重要,我們希望將出色的AI工具交到每個人手中。」山姆·奧爾特曼表示。

對於此次釋出會,此前外媒傳言OpenAI會釋出會新的智能搜尋能力,但隨後出現反轉——稱「散布釋出搜尋產品系抓捕公司內部泄密者」。此次釋出會,OpenAI沒有帶來新的AI搜尋產品,而是在虛晃一槍後釋出了升級後的GPT-4o。但除了新模型的效能提升外,OpenAI此次釋出,在有了更多產品效能改進之時,也出現了一些問題。

OpeanAI釋出會後,便有業內專家表示,「GPT-4o的多模態能力只是看起來很好,實際上OpenAI並未展示對於視覺多模態來說真正算是突破的功能。」此外,在即時音訊互動方面,目前國內諸如豆包、文心一言等產品也已具備類似通話功能。(文猛)