當前位置: 華文世界 > 科技

超過7萬億美元,阿特曼、孫正義都要重塑AI半導體行業格局,輝達用大模型反擊?

2024-02-17科技

圖片來源@視覺中國

文 | 元宇宙新聲,作者 | 賈桂鵬

2月17日,有知情人透露,日本投資界巨頭軟銀集團(SoftBank Group Corp.)創始人孫正義(Masayoshi Son)正在尋求籌集最高達1000億美元的資金,打造一家規模龐大的合資芯片公司。

據了解,該計畫代號為「Izanagi」,標誌著這位億萬富翁在軟銀大幅削減初創公司投資之際的下一個重大嘗試。知情人士表示,孫正義設想建立一家公司,能夠與芯片設計部門Arm形成互補,並讓這位億萬富翁能夠打造一家龐大的人工智慧芯片公司。

而孫正義的設想與OpenAI CEO山姆·阿特曼的計劃不謀而合,日前,阿特曼計劃籌集7萬億美元重塑全球半導體行業,如果這兩家企業的想法能實作,那對整個半導體行業都會造成巨大的沖擊。

其中,在AI時代順風順水的半導體巨頭輝達恐怕不樂於看到這樣事情發生,因此,他們想出的應對方案就是在大模型領域「狙擊」OpenAI。日前,輝達推出了自家版本的ChatGPT,名叫Chat With RTX。

而回到大模型領域的OpenAI日前也是重磅頻出,分別推出ChatGPT記憶功能和文生視訊模型Sora,也算是對輝達進入大模型領域做出回應。兩家企業分別在對方「主戰場」方向「擦槍走火」好不熱鬧。

那麽,在OpenAI繼續高歌猛進的同時,輝達為何要布局大模型呢?隨著輝達的入局,將會給大模型市場帶來怎樣的競爭呢?

OpenAI在大模型領域繼續開疆擴土

2月13日,OpenAI在一篇最新部落格文章中表示,該公司正在測試一項新功能,使這款流行的聊天機器人可以在每次交流時保留使用者提供的特定資訊。ChatGPT還能夠自動判斷,與使用者對話中的哪些內容應該被記住。

雖然為每個使用者建立更詳細的歷史記錄可能會產生新的私密問題,但這也是互聯網公司客製每個人的體驗並釘選客戶忠誠度的有效方法。OpenAI此前曾允許使用者為ChatGPT提供自訂指令,以避免使用者在每次聊天中重復贅述他們的偏好,而新功能無疑將進一步超越上述能力。

2月16日,OpenAI在官網正式釋出了文生視訊大模型Sora,其可以根據使用者提示生成長達一分鐘的視訊,同時保持視訊中出現的人物、景色的連貫性,甚至即便切換鏡頭,人物依然能夠保持一致。

在我們看來,Sora模型的釋出標誌著AI技術在內容創作領域的一個新紀元。

透過簡短的文本提示或一張靜態圖片,Sora能夠生成持續一分鐘左右的高畫質視訊,並涵蓋多個角色、不同型別的動作和背景細節等,幾乎達到了電影級別的逼真場景。這種能力不僅為內容創作者提供了前所未有的工具,使他們能夠以更低的成本和更快的速度將創意變為現實,而且為觀眾帶來了更豐富和多樣化的視覺體驗。

根據OpenAI的技術解讀檔來看,Sora是一種擴散模型,它能夠透過從看似靜態雜訊的視訊出發,經過多步驟的雜訊去除過程,逐漸生成視訊,不僅能夠一次性生成完整的視訊,還能延長已生成的視訊,透過讓模型能夠預見多幀內容,團隊成功克服了確保視訊中的主體即便暫時消失也能保持一致性的難題。

Sora是能夠理解和模擬現實世界的模型的基礎,OpenAI相信這一功能將成為實作AGI的重要裏程碑。

元宇宙新聲認為,OpenAI頻頻的新釋出,似乎在告訴所有人自己有足夠積累的同時,還會源源不斷的進行創新,他們還將繼續引領大模型市場的走向,但另一條訊息的放出,讓我們意識到僅僅是大模型的市場已經不能滿足OpenAI了。

山姆·阿特曼要撬動半導體市場

OpenAI的CEO山姆·阿特曼(Sam Altman)WGS(World Government Summit,世界政府峰會)透露,他正在計劃籌集7萬億美元重塑全球半導體行業。

值得註意的是,7萬億美元的融資數額,相當於整個西班牙所有房產的總和,而英國2023年的GDP為3.14萬億美元,更可怕的是,美國兩家最大的上市公司微軟和蘋果的市值相加剛剛超過6萬億美元。

而在半導體行業中,去年全球的半導體芯片市場總規模也為5270億美元,如果沒有阿特曼的計畫,預計到2030年也不會達到1萬億美元。這項投資也讓去年約1000億美元的芯片制造裝置市場相形見絀。

其實,阿特曼長期以來一直在談論人工智慧芯片的供需問題,對於目前的科技公司來說,要想在大模型的競爭中趕上潮流,就必須構建強大的算力設施,AI芯片正在成為瓶頸,而且已經一定程度上限制了OpenAI的成長。

據了解,在AI芯片上,OpenAI獲得了微軟的全力支持,阿特曼已與微軟執行長薩蒂亞·納德拉 (Satya Nadella) 和技術長凱文·史考特 (Kevin Scott) 也討論了阿特曼的計劃。

對此,輝達創始人兼CEO黃仁勛有些諷刺地回應道,阿特曼相信芯片行業將會推動AI成本下降:「(七萬億美元)顯然能買下所有的GPU,如果你認為電腦無法發展得更快,可能會得出這樣的結論:我們需要14顆行星、3個星系和4個太陽來為這一切提供燃料。但是,電腦架構其實在不斷地進步。」

不過,黃仁勛也強調,計算和AI技術仍在加速發展,相關支出在不斷增長:「目前全球數據中心的總價值約為一萬億美元,在未來的四到五年內,這個數位將增長到兩萬億美元,這些數據中心將成為全球軟體執行的原動力,在過去十年中,我們作出的最大貢獻之一就是將計算和AI推進了100萬倍。」

對於黃仁勛的這次高調發言,元宇宙新聲認為,在AI時代OpenAI與輝達本是上下遊合作企業的關系,但是此次阿特曼把心思放到了半導體行業,就有點踏入輝達的陣地了,這讓黃仁勛不得不防,而他們防範OpenAI的方法也非常激進,那就是直接進入到大模型領域。

輝達入局大模型領域

我們看到,輝達此次布局大模型並不只是玩玩而已,輝達的這款AI聊天機器人和目前主流的「選手」有所不同。它不是在網頁或APP中執行,而是需要下載安裝到個人電腦中。這波操作,不僅是在執行效果上會更快,也就意味著Chat With RTX在聊天內容上或許並沒有那麽多限制。

不過,我們也發現,Chat With RTX並非輝達自己開發的大語言模型(LLM)。在它背後是兩款開源LLM,分別是Mistral和Llama 2,使用者在執行的時候可以根據喜好自行選擇。

相較於其他大模型產品,輝達Chat With RTX由於是在本地執行,其生成答案的速度非常快,而且,它還可以根據線上視訊作出回答。對於這項技術,輝達官方只是簡單地說:「用到了檢索增強生成 (RAG)、NVIDIA TensorRTLLM軟體和NVIDIA RTX等。」看來擁有整個生態的閉環技術後,輝達的底氣很足。

不過,在首次步入大模型領域後,輝達也顯示出自己的弊端,The Verge在輝達釋出Chat With RTX後,立即展開了一波實測。但結果卻不盡如人意。例如他們在測試搜尋視訊功能時,Chat With RTX竟然下載了完全不同視訊的文字記錄。

而且,如果給Chat With RTX「投餵」過多的檔,例如讓Chat with RTX為25000個文件編制索引,它就直接「罷工」崩潰了。

但是The Verge在測試電腦內的文件時,也驚嘆了其速度和精準度。

因此,我們也得出了一個結論,Chat with RTX還是一個比較初級的產品,暫時不太適合用於生產。但它代表了一種趨勢,即讓AI模型更容易地在本地執行。而這也是在硬體端「大幅領先」後最大的優勢。

黃仁勛表示:「生成式人工智慧是計算史上最重要的一次平台轉型,它將改變包括遊戲在內的每一個行業。輝達擁有超過1億台RTX AI PC和工作站,是開發者和遊戲玩家享受生成式人工智慧魔力的龐大安裝基礎。」

元宇宙新聲認為,輝達此次入局大模型市場也不是爭一時之快,而是又一次透過軟硬結合的方式來布局未來的AI市場,這一次,Chat with RTX能否像CUDA一樣成功,就需要時間來給出答案了。

寫在最後

我們看到,憑借ChatGPT這款火爆的聊天機器人平台,OpenAI這家成立不到9年的公司,2023年的年收入已達16億美元,相比前年增長高達56倍。可以預見,隨著GPT-5即將推出,2024年的OpenAI或將褪去科技行業最強大的「黑馬」的角色,而是「登堂入室」,成為更重量級的角色。

此前,華為、英特爾以及美國政府的出口管制,已經對輝達在AI芯片市場的主導地位構成了嚴峻挑戰。此次,OpenAI與軟銀的虎視眈眈也讓輝達不得不防。在2024年年初一系列科技廠商們的動態,或許會推動AI、半導體市場甚至整個科技領域都在今年進入到新時代,是新貴高歌猛進,還是巨頭繼續統領市場?我們拭目以待。