9月5日,香港科技大學校董會主席、美國國家工程院外籍院士沈向洋在2024 Inclusion·外灘大會上分享了他對大模型產業落地的八個思考。他認為,AI Agent時代的到來,不會是一個神奇而強大的模型突然代替了所有工作流,它涉及技術、工程與市場的不斷磨合,最終以超預期的服務呈現給人類。
思考一:算力是門檻
「今天做大模型,做深度學習,首先最重要的事情是要有算力。」沈向洋表示。他指出,從2010年開始,大模型需要的算力以6、7倍的速度增長。這幾年穩定下來,大概每年有4倍的增長。模型越來越大,參數量越來越大,算力的需求也隨著參數的增長,呈現出平方向的增長。
在他看來,整個電腦芯片行業的發展已經從原來的「摩爾定律」變成了「黃氏定律」。以前摩爾定律認為,算力每隔18個月增長一倍。如今預測,GPU將推動AI算力實作逐年翻倍。「講卡傷感情,沒卡沒感情。以前有一句話叫貧窮限制想象力,現在貧窮可能扭曲想象力,因為如果沒有卡,能想象要做的專案可能就不太一樣了。」沈向洋感慨道.
思考二:關於數據的數據
公開資料顯示,GPT3的訓練數據達到了2個T的token(吞吐量),GPT4則達到了12個T左右。據沈向洋預判,GPT5的訓練數據可能會達到200個T。目前互聯網上的數據遠遠不能滿足未來模型訓練的需求,還需要思考用什麽辦法去挖掘更多的數據。
在人工智能領域,數據被視為模型的「燃料」,模型需要從這些數據中學習和提取有用資訊。因此,數據的數量、質素和多樣性都會直接影響到模型的準確性和效能。沈向洋表示,之前作為互聯網最核心的積累,數據大多被谷歌用來做搜尋引擎,以後這些數據都會被拿來訓練大模型。「互聯網40年積累的數據,好像就是為了這樣一個AI時刻」。
思考三:大模型的下一章
下一步到底要幹什麽?沈向洋認為,大模型產業未來的發展路徑已經非常明確,將會從之前的大語言模型,到多模態模型,未來邁向世界模型。從技術上講,肯定要走理解和生成統一起來的道路。「未來一定會往具身智能方向上走,往機器人上面走,其中一個特殊形態就是自動駕駛。」沈向洋說道。
實際上,關於世界模型業內並沒有形成一個標準的定義。OpenAI推出的Sora模型曾引發業內對「世界模型」的探討。OpenAI將其視為能夠理解和模擬現實世界的模型的基礎,相信其能力是實作AGI(通用人工智能)的重要裏程碑。然而,沈向洋認為,「Sora模型雖然做的非常好了,但還不是那麽強大,裏面的物理性質是不能保證的,做不到一個世界模型。」
思考四:大模型橫掃千行百業
大模型可分為通用大模型、行業大模型、企業大模型和個人大模型。沈向洋指出,通用大模型是AI的基礎,要訓練一個通用大模型至少需要萬卡;行業大模型是做領域套用的底座,需要千卡級別的訓練;企業大模型是企業數據價值的再發現,需要百卡級別的訓練。這些大模型都對算力的要求極高。「最激動人心的是個人大模型,比如聯想、微軟在推AIPC和蘋果的Apple Intelligence等都是朝著個人智能這個方向發展的。」沈向洋說道。
截至今年7月底,中國已備案大模型達到了197個,其中30%是通用大模型,70%是行業大模型。「可以看到,行業大模型占到絕大多數,未來肯定還會越來越多。」沈向洋表示。
思考五:AI Agent——從願景到落地
2024年5月,微軟公司創始人比爾·蓋茨公開表示,AI Agent不僅會改變每個人與電腦互動的方式,還將顛覆軟件行業,帶來從鍵入命令到點選圖示以來,最大的計算革命。
沈向洋對此觀點表示認同。他認為,人工智能時代,真正了不起的超級套用就是AI Agent。AI Agent從願景到落地的過程中,需要始終以需求為圓點,深刻理解模型的能力,並構建一個AI深度參與的工作流程。「今天在一家公司裏工作的話,整個工作流是非常復雜的,ChatGPT雖然很強大,但遠遠沒達到Agent的程度,它只實作了單點突破,真正要向前走還得融入整個工作流。」他說。
思考六:重視AI的 治理
AI治理非常重要。今年世界人工智能大會(WAIC)的主題就是在講AI治理,各個國家對於這件事情的看法有很多不一樣。AI的發展,對民眾、公司、政府監管、社會發展等各個方面都產生了強大的沖擊,引發了公眾對於其安全治理的擔憂。
「我覺得接下來人工智能的發展很重要的一點,從全球各個國家角度來講,是一定要做主權人工智能,而主權人工智能背後一定需要有一個主權雲來支持主權人工智能的發展。」沈向洋表示。
思考七:重新思考人機關系
「GPT帶來的沖擊有多少是人機互動的震撼,又有多少是機器智能的發展?」沈向洋認為應該重新思考人機之間的關系。他指出,AI為人類提供了與技術共生的全新語境,人機互動的新方式指向「AI與IA」的融合共進。IA(Intelligent Augmentation),即智能增強,代表著一種以人為本的 AI 發展路徑。它聚焦於運用技術提升人類的能力,而非取代人類,強調了人類與 AI 之間的協作關系。
「紐約時報專欄作者John Markoff 提到,電腦過去幾十年的發展路程裏,真正的贏家是做人機互動的。不管是什麽技術,最後的目的都應該是幫助人類更好地使用機器。」沈向洋表示,「到了AI時代,人機互動最本質的是對話,就像ChatGPT這樣。ChatGPT加上微軟,會不會成為AI時代最偉大的公司?我想只有時間才能夠驗證。」
思考八:智能的本質
今天,GPT的發展如火如荼,但實際上,人們對智能的理解還是非常有限的。不同於物理學,上到浩瀚的星空,下到微小的量子,都能有一個大一統的理論可以解釋;今天的深度學習很多東西都是不可解釋的,沒有魯棒性。
「智能的本質是神經網絡與符號系統的世紀之爭。」沈向洋說道,「今天,雖然人工智能的發展還處在一個相對來講比較早期的階段,但是行業上已經有很多的套用,值得下定決心去做,我對未來的發展充滿信心。」
作者 丨宋婧
編輯丨趙晨
美編丨馬利亞
監制丨連曉東