當前位置: 華文世界 > 科技

項立剛:GPT-4o有哪些技術突破?|宅男財經

2024-05-15科技
03:53
【宅男財經|專家面對面】當地時間5月13日上午,OpenAI舉行春季釋出會。這次釋出的產品並非搜尋引擎或GPT-5,而是GPT-4的叠代版本——GPT-4o。OpenAI技術長Mira Murati表示,GPT-4o具備GPT-4的智慧水平,但處理速度比GPT-4 Turbo快了一倍。
GPT-4o技術水平如何?中關村資訊消費聯盟理事長、通訊專家項立剛表示,GPT-4o在人工智慧計算、理解能力上和GPT-4並沒有本質不同。從產品命名的角度看,它之所以不叫GPT-5,可能也是因為它沒有革命性的突破,但GPT-4o也有一定的能力提升。
釋出會上,GPT-4o表現出多模態理解和輸出能力,它能夠跨聲音、文本和視覺進行智慧推理,可以就使用者給出的截圖、照片,或含有文本和影像的檔展開對話。項立剛表示,此前ChatGPT主要是透過「文字對文字」的形式工作,即它在接收相關文字後經過處理,輸出的也是文字,而GPT-4o擁有了多模態理解和輸出能力,它接收的資訊可以是文字、圖片、聲音和影像。
比如在釋出會上,OpenAI的研發負責人就與GPT-4o進行了語音對話;同時,GPT-4o在處理視訊時,還能在一定程度上理解人的情緒。項立剛認為,GPT-4o雖然沒有在人工智慧的計算能力方面實作質的飛躍和革命性的改變,但是它的一系列表現,以及理解和輸出能力從單模態向多模態的轉變,未來它會更真實地了解和理解世界。這些能力可能會被植入到機器人中,使它能夠透過網路攝影機或感應器對周圍的環境,包括人的情緒、態度等有更深入地理解。
「雖然GPT-4o的表現並非盡善盡美,但是我們可以看到它的發展方向,在人工智慧的推理計算上的革命性飛躍可能目前還無法達到,而在這個過程中對於多模態進行辨識理解並輸出的發展方向越來越明顯。」
項立剛提到,GPT-4o釋出的背後也反映出OpenAI所面對的一些實際情況。比如GPT-4o同時面向付費使用者和免費使用者,雖然付費使用者的訊息限制是免費使用者的5倍,但一定程度上反映出OpenAI目前的使用者增長不是非常多,它的收入情況不是很好。在這種情況下,公司為了維持自己的使用者數就不得不開放免費註冊,然而免費使用者的加入也並不會產生收入,未來OpenAI或許還會面臨一定的困難。
項立剛稱,透過OpenAI的釋出會可以看到,GPT技術在不斷積累中已經從算力堆砌發生改變,逐漸開始變得更加關註人性化及多模態理解和輸出能力,這種能力對未來的人形機器人發展更有幫助,它在與人交流溝通的過程中會更加順暢、更加方便,並且更加理解普通人的感受。
(記者 董湘依 制作 常晴朗 余坤航 宅男財經出品)
更多精彩內容請關註中新經緯(jwview)官方微信公眾號。