當前位置: 華文世界 > 科技

多模態AI全線提速!ChatGPT-5 即將釋出,龍頭廠商全梳理

2024-03-30科技

近期有媒體報道,ChatGPT即將在未來幾個月內迎來全新版本,OpenAI公司CEO柯曼正帶領團隊緊鑼密鼓地推進研發工作,有望在今年夏季正式推出GPT-5。

自2022年底ChatGPT橫空出世以來,全球範圍內掀起了大模型創新的熱潮。當前大模型從單模態向多模態趨勢持續演進。

大語言模型在文本端的套用已經趨於成熟,無論是在自然語言處理、機器轉譯還是智能問答等領域,都取得了顯著的成果。與此同時,影像和影片生成技術也在快速發展,AIGC浪潮全面加速!#人工智能#

大模型朝多模態方向發展:

資料來源:中關村產業研究院

算力端方面海外大廠對硬件的投資持續且強勁。Meta在2024年有望進一步擴大對GPU的投資,以支撐其在人工智能領域的持續發展。微軟、Google和Amazon等科技巨頭也預計在新的一年裏繼續擴大資本性支出,以支持AI技術的研發和套用。

隨著大模型的持續叠代和相關套用的不斷湧現,影片生成領域有望在2024年迎來新的發展熱潮。

想了解更多精彩內容,快來關註樂晴智庫

多模態行業概覽

根據處理數據類別數量的不同,AI模型可以分為兩類:單模態和多模態。

單模態模型只能處理一種類別的數據如文本,多模態模型則可以處理兩種及以上的數據類別,類似於人腦能夠同時處理文本、聲音、影像等不同類別的資訊。

多模態大模型透過結合文本、影像等多種模態資訊進行學習,能夠充分利用大模型的泛化能力,構建多模態數據集,並解決融合和對齊等問題。從而提升其在多個感知任務上的效能和表現。

多模態大模型的框架包括數據、演算法和套用三個層面。

多模態大模型框架:

多模態市場競爭格局和龍頭梳理

當前,海外的大語言模型技術正邁入一個新的突破階段。大模型領域已形成一超多強的競爭格局,OpenAI雖處於領先地位,但正面臨其他競爭對手的加速追趕。

Sora模型的釋出,標誌著影片生成模型迎來了類似GPT3的重要時刻。海外初創公司Pika其模型效果在短時間內得到了顯著提升。而Google釋出的VideoPoet更是基於LLM的技術路徑,展現出了令人印象深刻的影片生成能力。

海外多模態加速授叠代:

資料來源:IT之家

國內大語言模型的能力也不斷取得突破,大模型領域呈現百家爭鳴的態勢。據IDC數據顯示,為應對多模態技術這一發展趨勢,中國雲廠商、創新企業、AI企業、大數據企業和傳統軟件企業都在積極布局多模態技術。

百度釋出了文心一言、阿裏巴巴釋出了通義千問大模型、商湯科技釋出了日日新大模型等等。此外,科大訊飛釋出的星火大模型3.5能力與GPT-4相當,基於全國產化算力平台「飛星一號」,星火大模型V3.5實作了七大能力提升。通義千問推出的2.0版本能力趕超了GPT 3.5;Minimax在國內推出了MoE模型abab6;百川智能上線的Baichuan3在中文、醫療能力方面表現優秀;三六零自研的千億參數大模型——360智腦4.0功能覆蓋了大模型套用的所有場景,並成為了首批透過國內首個官方「大模型標準符合性評測」的四個大模型之一。國內還湧現出一批套用於金融、醫療、教育、工業等領域的行業大模型,拓寬了大模型的套用邊界,截至2023年11月,國產大模型的數量已激增至300多個。

大多模態產業鏈方面,AI套用與算力廠商正在加速參與布局,代表廠商包括金山辦公、福昕軟件、萬興科技、美圖公司、用友網絡、金蝶國際、恒生電子、科大訊飛。基礎設施方面代表廠商主要有浪潮資訊、中科曙光、工業富維、拓維資訊、神州數碼、海光資訊等。

隨著AI在全球持續爆發,多模態領域的各路廠商不斷加速創新和突破,將為全球大模型的發展和套用提供更多可能性。

關註【樂晴智庫】,洞悉產業格局!