(圖片來源:鈦媒體App編輯林誌佳拍攝)
鈦媒體App 10月25日訊息,鈦媒體App獨家獲悉,AI 大模型領域的獨角獸MiniMax將於今年11月釋出對標GPT-4o的Realtime API服務,將提升端到端即時多模態處理能力,並帶來更低延時、更自然、更沈浸的即時語音對話,為企業協作、社交、直播、遊戲等多種場景提供服務。
這是MiniMax推出的首款端到端即時語音對話產品。訊息人士告訴鈦媒體App,內部正在打磨這款產品,並非常希望11月釋出時產品效果直接對標OpenAI GPT-4o。
據悉,今年5月,OpenAI公司推出可免費使用的全新旗艦AI模型GPT-4o,可即時進行音訊、視覺和文本推理,它可以在短至232毫秒、平均320毫秒的時間內響應音訊輸入,與人類在對話中的反應速度一致。在API使用方面,相比去年11月釋出的GPT-4-turbo,GPT-4o價格降低一半(50%),速度提升兩倍(200%)。
OpenAI CEO奧爾特曼(Sam Altman)在推文中表示,新的GPT-4o是OpenAI有史以來最好的模型,它很智慧,速度很快,是原生多模態,並且它可供所有ChatGPT使用者使用,無論是免費版本還是付費GPT-4版。
今年10月,即時語音技術公司、聲網的兄弟公司Agora作為語音API合作者出現在了OpenAI 釋出的Realtime API 公開測試版中。而MiniMax也看到了機會,開始與聲網進行合作,聲網創始人兼CEO趙斌在RTE 2024 第十屆即時互聯網大會上表示,聲網與MiniMax正在打磨中國第一個Realtime API,基於該API的智慧體產品,能夠與人類進行輕松且流暢的即時語音交流。
除了MiniMax,目前包括科大訊飛、智譜AI、商湯科技等中國企業都在研發生成式AI對話產品,均與GPT-4o效果不相上下,OpenAI近期也開放了ChatGPT-4o對話功能。
根據艾瑞咨詢的統計,2021年,對話式AI的市場規模為45億元,帶動規模126億元。預計2026年,對話式 AI 市場規模將達108億元,帶動規模超385億元,五年復合年均增長率(CAGR)達32.5%。
(本文先發於鈦媒體App,作者|林誌佳,編輯|胡潤峰)