當前位置: 華文世界 > 科技

OpenAI推出GPT-4o,這些能力獲得大幅升級,對所有使用者免費開放!

2024-05-14科技
  • OpenAI 推出了 GPT-4o,這是一個改進版本,具有更快的響應時間和新的語音技術。

  • GPT-4o 提供即時文本轉語音響應,並能夠調整情緒化的語調。

  • 與以前的型號不同,GPT-4o 免費提供給所有使用者,付費使用者可以獲得卓越的容量。

  • OpenAI 周一宣布了其最新的人工智慧大型語言模型 GPT-4 的叠代 GPT-4o,據稱這將使 ChatGPT 更智慧、更易於使用。

    GPT-4o

    據了解,更新後的模型「速度更快」,並提高了「文本、視覺和音訊的能力」,OpenAI 技術長 Mira Murati 在周一的直播公告中表示。穆拉蒂補充說,它將對所有使用者免費,付費使用者將繼續「擁有高達免費使用者五倍的容量限制」。

    OpenAI 在該公司的一篇部落格文章中表示,GPT-4o 的功能「將叠代推出」,但其文本和影像功能將於今天開始在 ChatGPT 中推出。

    OpenAI 執行長 Sam Altman 表示,該模型是「原生多模態的」,這意味著該模型可以生成內容或理解語音、文本或影像中的命令。Altman 在 X 上補充說,想要修補 GPT-4o 的開發人員將可以存取 API,它的價格是 GPT-4 Turbo 的一半,速度是 GPT-4 Turbo 的兩倍。

    作為新模型的一部份,ChatGPT 的語音模式即將推出新功能。OpenAI 表示,GPT-4o 的工作方式與 GPT-4 類似,但工作速度比前代快得多。GPT-4o 還在其語音模式背後添加了新技術,人們使用麥克風與 ChatGPT 交談。OpenAI 希望使用語音模式與 ChatGPT 交談,就像與真人交談一樣,但演講者完成和 ChatGPT 回復之間的延遲破壞了沈浸感。現在,該公司正在 GPT-4o 背後添加新技術,使與聊天機器人交談感覺盡可能自然。

    他們還展示了檢測使用者情緒的模型;在一個例子中,它傾聽了一位高管的呼吸,並鼓勵他冷靜下來。

    根據該公司周一的演示,GPT-4o 將有效地將 ChatGPT 變成一個數位個人助理,可以進行即時的口語對話。它能夠使用文本和「視覺」進行互動,這意味著它可以檢視使用者上傳的螢幕截圖、照片、文件或圖表,並就它們進行對話。

    比如,演示者寫出了一個方程式式,並透過手機網路攝影機將其展示給 GPT-4o。主持人要求 GPT-4o 幫助他們解決這個問題,但不要透露答案。果不其然,GPT-4o 指導演示者完成解決簡單方程式的過程,就像一個好的數學老師一樣。此外,它甚至還回答了典型的「我什麽時候會在現實生活中使用它?」的問題,解釋了二次方程式如何幫助我們完成日常任務。

    演示者還使用桌面版的 GPT-4o 來檢查他們擁有的一些程式碼。GPT-4o 不僅可以解釋程式碼的作用,還可以告訴如果你調整它的特定部份會發生什麽。示威者表明,GPT-4o 可以充當現場轉譯,聽兩個人說不同的語言,並告訴一個人用他們的母語說了什麽。

    OpenAI 技術長 Mira Murati 表示,ChatGPT 的更新版本現在還將具有記憶功能,這意味著它可以從之前與使用者的對話中學習,並可以進行即時轉譯。

    「這是我們第一次在易用性方面真正向前邁出了一大步,」Murati在公司舊金山總部的現場演示中說。「這種互動變得更加自然,也變得更加容易。

    Murati 表示,OpenAI 將在未來數月內為Windows和Mac平台推出具有 GPT-4o 功能的 ChatGPT 桌面應用程式。GPT-4o 也將提供給希望從 OpenAI 的 GPT 商店構建自己的自訂聊天機器人的開發人員,該功能現在也可供非付費使用者使用。他表示,免費 ChatGPT 使用者與新 GPT-4o 模型的互動次數有限,互動次數用盡後,然後該工具會自動恢復基於舊 GPT-3.5 模型的問答。

    新版本釋出之際,OpenAI 尋求在 AI 軍備競賽中日益激烈的競爭中保持領先地 位。包括谷歌和 Meta 在內的競爭對手一直在努力構建越來越強大的大型語言模型,這些模型為聊天機器人提供動力,並可用於將 AI 技術引入其他各種產品。

    #熱點引擎計劃#OpenAI 表示,已經有超過 1 億人在使用 ChatGPT。但是,更新的 ChatGPT 體驗——以及在桌面上和透過改進的語音對話與之互動的能力——可能會讓更多人有理由使用OpenAI的服務。

    OpenAI 活動是在谷歌年度 I/O 開發者大會的前一天舉行的,預計谷歌將在大會上宣布其 Gemini AI 模型的更新。與新的 GPT-4o 一樣,谷歌的 Gemini 也是多模態的,這意味著它可以解釋和生成文本、影像和音訊。OpenAI 的更新也發生在蘋果在下個月的全球開發者大會上宣布 AI 之前,其中可能包括將 AI 整合到下一個 iPhone 或 iOS 版本中的新方法。

    與此同時,最新的 GPT 版本對 Microsoft 來說可能是一個福音,該公司已向 OpenAI 投資數十億美元,將其 AI 技術嵌入Microsoft自己的產品中。