當前位置: 華文世界 > 科技

朱雲來、吳軍萬字對話:人工智慧下一步

2024-07-11科技

中金公司原總裁兼執行長、清華大學管理實踐存取教授朱雲來資料圖。

本文為2024世界人工智慧大會暨人工智慧全球治理高級別會議「AI 規模新經濟」--投融資主題論壇的討論實錄,由新經濟學家智庫整理,有刪改,未經本人確認。

本帳號接受投稿,投稿信箱:[email protected]

朱雲來、吳軍對話:人工智慧下一步

王曙光: 尊敬的各位嘉賓,各位朋友,下午好,歡迎來參加中金公司的論壇,也很歡迎能夠來參與我們這次討論。(王曙光為中金投資銀行業務負責人)

我作為本次高端對話的主持人,首先向各位介紹一下今天的兩位嘉賓,一位是坐在我左側的朱雲來教授,朱雲來教授以前也是中金公司的CEO,現在是清華大學的存取教授,然後線上還有一位吳軍博士。吳軍博士好。

吳軍: 大家好,主持人好,很高興跟大家線上上(交流)。

王曙光: 吳軍博士是人工智慧方面的專家,也出了很多跨界的書籍,像浪潮之巔這些特別有名的這種科技的暢銷書。特別感謝吳軍博士在美國線上參加,此時已經是美國的深夜,但是中國人工智慧的這種熱度,相信能夠使得吳軍博士能夠打起精神參與我們本次的高端論壇。


在開正式開始論壇討論之前,說點題外話,我剛才聽了彭博(彭文生)的報告,我覺得未來有一個職業大機率會被替掉,就是像我這樣的論壇主持人。我覺得未來我可能是少見的一些還真能夠現場參加的主持人,因為我說主持人一般在幹嘛?

第一,搜尋社會上的熱點問題 ,其實這一步工作只需要用 ChatGPT 或者是用中國的這些大模型,你輸入幾個字,現在社會上最關心AI,尤其是比如說經濟界或者投資界最關心有哪些問題,一頁紙出來了,然後這個問題有了。未來像中金公司的那位,我們的智慧員工,他就可以直接在那,用比我更好聽的語音和嗓音,然後來問嘉賓們問題。

第二個就是問問題 ,問完問題之後基本上作為主持人要總結歸納一下嘉賓說的什麽話。這個剛才彭博士的報告也講得很清楚,包括剛才薩金特教授也講得很清楚,歸納並復述,這個是人工智慧最基本的一些功能,這個東西也被替代了。

第三,那就是引導嘉賓們討論,甚至是爭辯 。這也是人工智慧特別擅長的領域。所以我說今天有可能是人工主持人在上海人工智慧大會上的最後的演出,所以希望明年人工智慧的進步能夠使得像我們這樣的人就不要出現了。因為我說像我們現在還需要人工主持的主持詞對吧?這些其實都是對社會資源的浪費,明年希望咱們的主持能夠變得更加人工智慧一些。

我覺得第一個問題還是先請吳軍老師來幫我們分享,因為實際上人工智慧技術經歷了從簡單規則到深度學習和神經網路的快速發展,在這個過程中 AI技術已經廣泛套用到各個領域,如今在影像辨識、自然語言處理和預測分析方面已經顯示出了強大的能力。

近年來,包括在自動駕駛、醫療診斷、金融、教育、創作也都有很多的套用,還是首先想請吳軍博士和朱教授分享一下,你們作為行業達人是怎麽看待AI技術的演變及未來套用的這種真實的潛力?先有請吳軍博士。

吳軍: 我談談我的看法。人工智慧到發展到今天基本上是第四波的浪潮或者是第四波的熱捧。

第一波其實是從有電腦開始,到60年代初。剛才主持人講了說用一些簡單的規則來做人工智慧,當時人類的想法很簡單,就是人怎麽思維的,就是我們要怎麽做人工智慧,當然後來證明這條道路行不通的。

這就如同人類發明飛機的時候,其實它不是學鳥在飛行,不是在振動翅膀,人發明的飛機的翅膀是不振動的。人類搞清楚了空氣動力學的一些原理,在這個基礎上他又發明了飛機,這就能做的比較好了。但是整個第一代人工智慧時代,人類完全不知道機器來實作人工智慧該怎麽做。

到了上世紀70年代其實是美國的一個教授,後來是IBM的一個負責人,就是賈裏尼克教授提出語言模型,這才開始了數據驅動的人工智慧,但是由於數據量不夠,計算量也不夠,一開始其實成果不是很能讓人信服。一直有爭議,就是說按照這條路能不能走下去,有一些問題能夠得到解決,有些問題解決不了,中間也起起伏伏,這就是第二波的浪潮,起來又下去了。他的那些同事,後來其實除了他自己還在做人工智慧,剩下來人都去了一家非常有名的,中金大概每個人都知道的一家公司,叫做文藝復興技術公司,都掙著大錢了,用人工智慧的技術去解決語言的問題、影像的問題,都沒解決好,最後做股票預測掙到大錢了,當然這是題外話。這是第二波熱潮起來又冷下去。

賈裏尼克資料圖。

在這個時候又出現了第三波,今天的人工神經網路用的這個,但是也是受限於規模,受限於這個數據,也沒做好,所以在2000年的時候,大家都不好意思說自己是做人工智慧的,因為你說這個一定找不著工作,大家說自己做機器學習的,就是這糊弄事了。

這時候就出了那幾個人,就是本傑歐、楊立昆和新的他們幾個人搞人工神經網路,把很基礎的演算法給搞出來了,但是沒成果,而且他們甚至也不知道為什麽要做這些東西,覺得這些演算法很好,非常好,非常有意義,說有什麽用沒人知道。

楊立昆資料圖

直到後來Google這些公司有了大量的數據,有了大量的計算能力,然後實作了深度的人工神經網路,這才開始其實也就是從2010年開始做,2016年取得初步成果,後來又提出了今天我們的transformer這一套,把人工智慧問題然後變成一個深度學習的問題這樣一套方法。

那麽在這個基礎上有了今天ChatGPT,大家從2016年其實人工智慧開始熱了,因為當時Alpha狗贏了李世石,在中國有了很多的套用,主要是人臉辨識,在世界上無人駕駛現在也很靚麗,那麽然後有了ChatGPT解決了語言學的很多問題,今天人工智慧才熱起來。

資料圖

實際上從它的發展的時間來看,以及它的成果來看,也就是發展了60年,大概它的成果集中在最近的十年。所以人工智慧其實還是處在一個相對早期的階段,它做了一些事情,但是和它未來的潛力相比發揮的還非常小。

在未來的時間裏,我們剛才講了這4個階段,今天這個階段其實是其中的一個階段,如果大家覺得說這一個階段能解決什麽問題,我覺得過分樂觀了,還有好多問題其實沒有解決。

剛才我聽了前面的幾個報告,比如說是否讓人工智慧來模擬人,其實這種想法一直有,但其實到現在為止解決的都很不好,非常的粗淺,所以人工智慧還有很大的潛力,有很長的路要走。今天做的在很多領域其實超過了人已經很不錯了。

剛才我也就主持人一開始一個自謙的說法,說是不是將來就沒有主持人了。其實人工智慧他擅長回答問題,不擅長提問題。世界上不光是人工智慧,世界上最難的事情是提問題。

我問過很多最優秀大學教授,世界一流大學大教授,也跟國內一些一流大學的教授們討論過,最後大家有一個共識,像MIT或者史丹佛這些大教授或者能得諾貝爾獎的這些教授,他們跟我們國內的清華或者復旦這種一流的教授比有什麽差別,或者差距在哪裏? 差距在於提問題 ,不在於解決問題,也就是說國內一流教授解決問題的能力不比美國這種頂級的世界頂級的教授差,但是能夠提出好問題是非常困難的事。所以我覺得在今後像我這樣回答問題的人可能就不存在了。提出好問題的人永遠是很稀缺的,先跟大家分享這些。

王曙光: 謝謝吳軍教授,突然間使得我們在評價資深員工的KPI上多了一條,只有能夠提出好問題的老板才是好的老板,現在看來是應該這麽有一個向上評價的額外的KPI,我把這個問題再轉給朱教授,請朱教授做分享。

朱雲來: 很高興能參加討論,吳軍博士是業內著名的專家,他寫了可能得有幾十本書,我記得當時有個什麽叫【 浪潮之巔 】,後面一系列的,我這個充其量算一個業余愛好者,不過是一個 非常熱情的追隨者。

其實粗算一下歷史,剛才吳軍也講了大概有4代,算一下,如果我們把圖靈當時他破解密碼應該也算是人工智慧了,對吧?從那個時代到現在,1945年二戰結束到今天2024年差不多也是80年,80年4代,一代20年,其實跟我們人類的叠代也挺有點像。但是 浪起 浪伏 ,一次都是給你帶來特別大的一個希望,如果你去翻一翻歷史上他們當時宣稱離人工智慧有多近,你會感到非常的激動,但最後他又過去了,好像遠遠沒有達到這個目標,但是過一段時間突然又崛起了。

資料圖

怎麽看這個問題?我覺得這一次,第四次,特別是去年ChatGPT的崛起,應該是說給了我們一個前所未有的一個嶄新的感受,又讓我們重新燃起了對人工智慧的期望和好奇。

我覺得它確實是一個非常大的進步,其實是顯示出來我們人類可能逐漸的在找到這個感覺。從最早的電腦的設計利用變成了更多的去模仿人類的能力,到現在我們好像找到了一點感覺,其實可能每一次我們都是想的是一個非常完整的、高水平的綜合人的能力,但其實從經濟學的角度,其實你不需要完成所有最高的,你能把大量的、基礎的能夠非常有效的推廣以後,他可能已經能讓社會經濟大大的前進一步。

我比較一下這一次有可能一個潛力是說達到一個 工業革命級 的是吧?比方說過去有蒸汽機革命,這算是第一次工業革命。它其實只是系統的潛在的能源的供應,以及能源的成本降低,所以它實際上就是推動了全世界的經濟發展。第二輪典型的是電力,還有好多各種專業性的革命。這一次我為什麽覺得就是說人工智慧有了一個新的特點?

在過去你想想,從電腦發明到後來的一系列的套用,電腦概念,說到底它就是一個芯片,它可以接受指令來完成各種具體的操作。但現在慢慢的我們把它越來越系統化了以後,我發現這一輪的 AI如果說跟以前的各種各樣的電腦的套用相比的話,它好像多了一個特點,它是能夠自己來執行,它是以完成某一個任務為核心。

過去只是說你讓我開關,你讓我開這個我開這個,你讓我開那個我開那個,然後剩下的事情還是你人類做的,但其實作在我們已經總結到一定的程度,就是說我可以給他一個指令完成一個功能,甚至說是指令都不用給了,我想要達到一個什麽目標,然後你電腦自己去組織你的一些指令,變成了完成的任務。

所以這一次的話,我們又發現比方說透過像GPT這樣的,他用了所謂大量的語料,這個語料它其實本質上應該還是神經網路的概念。神經網路實際上是說這裏邊的參數,原來我對這個參數理解可能有點不太準確,我也是在一路在學習。

原來擔心,你看GPT第一代上億的參數,接著第二代就10億,然後第三代百億千億,到第四代萬億級的參數,我當時覺得這玩意有點太快,這麽一個大概3年多4代這個參數就上一個量級,我說這個是不是有點反莫耳定律?莫耳定律是說每過一年我成本降低一半,你這個是說每過一年成本上升10倍,上升了一個量級,是不是有點這個問題?後來我發現不是,這個參數它本質的意義是說我們的神經網路的復雜性,它其實是我們的權重系數,最近新出來的好多 GPT開源版的,那就變成什麽7B了13B了,7B也就是70億,比原來到什麽萬億千億的水平其實小了很多了。

所以可能是說你要用一個多復雜的神經網路系統來才能夠去理解總結這個世界,可能我們現在也找到這個感覺了。

另外一方面就是說,我們要認識的世界的物件,實際上就是我們的語料一個trillion還是多少個trillion,就是萬億,多少個萬億的要被認識的物件,這些逐漸的是在我們掌握之中了。

但是現在的人工智慧還是有一個本質上的問題,就是說它,不是有一句話叫做什麽,一本正經的胡說八道。為啥?其實後來我看了一下,神經網路的本質,它的背後實際上它是在不斷的概括歸納這個規律,其實剛才薩金特教授也提到,我們實際上是怎麽相容了一次,然後怎麽去拍成MAC內審,所以它其實本質上還是一個模式辨識,而且它辨識了以後它就不分真偽了,普遍運用,所以它很一本正經,為啥?因為它都是一個電腦的演算法模式出來的,所以他一本正經,然後胡說八道,實際上是什麽?他可能90%都是對的,但是有10%也是錯的。但它也把那10%的錯的也當成對的照用,所以也就變成好像有點信口開河了,或者我說他這種學習方法,其實這是對世界的一個學習,他有點生搬硬套,但是至少我們現在發現,因為我看到GPT回答的速度和他回答的合理程度,這是驚人,我都是奇怪這機器怎麽能做到,但是後來我想想從方法論,從科技框架來講,這個還是一個很重要的進步。

薩金特資料圖

其實下一步我覺得我們需要的是,你把這個可以看成是一個學習,是照貓畫虎,我系統的學習。電腦他學得快記得牢,所以他能夠大大的超過個人思維的水平,而且它互相之間是可以整合的,所以它效果就更大。

做完這一點,但是還是有錯,你不能把你所有的都這麽如此推論,所以後面可能就需要一個證明,你90%的歸納觀察,可能都是對的,但是有10%不對,不對的東西你怎麽糾正?

你要證明,比方說你潛在的從歸納裏邊得出某一種規律,但是你下次你說我要證明一下你這個規律是不是確實的,是不是真正存在的。過去電腦證明其實是有一個很著名的四色定理的電腦證明,反過來說,如果你完成了證明這一層了,你再去推演、推理、推斷,你都是對的,你找來的根據都是對的,你再繼續推斷。不斷的推理,擴大人類的知識,觸類旁通,由此及彼,它又是比人快得多對吧?

最後你想想,其實電腦你只需要模擬一下我們人類的intelligence,剛才薩金特教授也談了半天,就說如何定義 intelligence,其實什麽是intelligence,就是一件事兒你怎麽做,你能做什麽。比方說我歸納我先弄一大堆,然後歸納出來以後,但是這歸納是一些似是而非的定律,然後我來證明,證明以後,我再拿這些我知道的證明了的定律,再系統的再去推論。所以其實這樣我們很快能夠build一個很大的我們的理論體系、知識體系了。所以從這點來說,我覺得電腦應該是有很大的希望往前走。

這個簡單說一個問題,就是剛才薩金特教授也提到,它對人類的替代的問題怎麽辦?待會我們有機會我們後面再講,但至少說前景, AI可能是會給我們帶來確實一個很大的科技的提升,這對我們的經濟的發展,對我們經濟的往前躍進應該是說很有潛力。

當然他現在還有很多一些問題,包括多重投資,大家所有人都巨額的去投資,這個方法是不是最好,也是值得商量,然後它可能產生的對社會替代的問題也是一個潛在可能我們需要考慮的,我先提到這兒。

王曙光: 感謝吳博士和朱教授的分享,其實我都發現他們的觀點中其實很隱晦的反向提出了一個問題,就是人工智慧現在的發展到底是不是真正能夠做出很多對人類社會的福祉更加突破性的事兒。

因為實際上剛才二位都提到了,人工智慧目前的基礎設施的投資,現在有點軍備競賽的感覺,我們的同行高盛也是說,預計要達到一個比較良好的使用基礎的話,至少是1萬億美元的投資,可是1萬億美元的投資到底能夠產出多少,尤其是剛才彭博士也在他的 AI經濟學中講到了,中國在套用側歷史上彎道超車的可能性更高,現在AI如何與套用更好的結合,如何能夠快速的來提高真正投資AI的這些公司的收益和利潤率,這點的話,這個也想聽聽兩位嘉賓對這個行業的一些建議,先請吳博士您來分享分享。

吳軍: 剛才您這個問題是非常好的一個問題。

剛才講1萬億,這1萬億我是這麽想的,他這1萬億並不是一個誇張,他這個投資並不是說我今天投1,000億,明天投1,000億,最後投了1萬億以後才有效果,他是一邊投一邊會產生很多效果。他有時候是會把自己掙到的利潤,比如說投資人工智慧掙到的利潤再拿去再投資,這麽算下來1萬億,這是一個合理的估計。

1萬億美元,當然對很多人來講說這是天文數位,但其實你跟一個國家GDP比,全世界現在GDP100萬億對比,其實科技公司的投資其實也不算太高。剛才您講的時候我正好把我原來的一個筆記拿出來看了一下,2022年美國幾大的科技公司,他們的研發投入多少?亞馬遜大概是580億,第一。Google460億,第二。然後蘋果300億,微軟的270億,光是這4家加起來已經是,大家可以大概加一下,一千三三四百億,這是一年的投資。你要說有個十年下來,這幾家公司投資都已經超過1萬億了,當然它不光是投資在人工智慧領域,還投資在別的領域了。

在歷史上,可能在座的做投資的應該有體會,在IT領域的投資,歷史上基本上是投一塊錢能掙三塊錢。在有一些國家,像中國當時是做的比較好的,大概就是投一塊錢掙三塊錢基本上能做到,非洲可能差一點,你電信的投資一塊錢可能能掙回兩塊塊錢,但基本上也是掙的。就是說全世界很多投資它不一定能夠把成本掙回來,包括房地產的投資也都不一定能掙回成本,但IT投資從長遠來看,從宏觀來看,這個錢是能掙回來。所以我相信雖然在人工智慧上的投資看似很多,其實你看單筆投資最大的一筆是微軟給OpenAI的投資,大概百億這個量級,當然也就僅此一筆了。

Google給安卓PK這些投資規模要小很多,加起來和我說的大公司內,他們自己的IT的投入來講,其實還是小頭,所以我覺得現在投資,估值有很多泡沫,但是你說投資真的投的錢是不是已經過多了,我倒不覺得。

但是 現在的問題是什麽?投 資有點太分散。以咱們國內為例,大大小小的自稱自己在做大模型的,肯定有超過上百家,因為我看有些榜單說前50家怎麽著,你既然說前50家肯定還有後面的,大大小小已經上百家了,有的投資就是一兩億人民幣。一般的風投一兩億人民幣不算少了,在 AI上今天投資一兩億人民幣,其實做不了什麽事情。

所以我覺得,我們現在實際上可能需要國內一些,尤其像國家隊這樣的大的一些基金,重點的扶植若幹家,就是不超過10家,因為這本身是一個很燒錢的事情。就是剛才前面也講了電力的消耗,這還是第二位的,比如GPU現在很貴等等這些,這些我覺得是第一個梯隊,就是說重點的可能投資個位數不到10家,然後大部份應該鼓勵大家做一些輔助性的工作以及一些具體的套用。

比如說,剛才我們都談到了數據,今天很多都在講我們怎麽建模型,但是很少有人講我怎麽能夠為各家大模型來提供幹凈的可靠的數據。數據的品質差,訓練的模型就差。在矽谷有一家很成功的做AI的公司叫coAI,它其實不做任何AI的模型,它就是給AI提供數據。它包括制造很多工具,讓人很容易的來判別數據的真假,它就有很多這種相當於人工的稽核的這樣一些人,他能把全世界的組織起來,這也是很不容易的一件事情。

還有很多的套用,像現在比如說我們有開源的大模型,你拿來用其實就省了很多的訓練時間和成本,我們能夠運用到各行各業去,你今天用到醫學上其實還是蠻少的,大家很多還是在文本這個領域,就是說讓他寫個文章回答個問題,因為演示的效果比較好,醫學上演示的效果不算那麽好,把它套用到醫學上,套用到我們很多工業的管理上等等,就是說有很多的套用的場景,我覺得我們很多投資的也好,創業的也好,應該更關註這些領域,當然關註這些領域也就需要大家深入到各行各業去了解各行各業的情況,就是說我們獲得叫做knowledge,就是關於各個行業自己本身的這些知識和解決他們的問題。所以我覺得說今天看似有點過熱,也確實是估值上有點過熱,但是從投資來講是我們目前各國的社會是能夠承受的,而且我也相信各國的政府和投資領域的這些基金,還會在未來的大概10年內還會繼續大力的來支持支持人工智慧的發展。

吳軍資料圖

王曙光: 好,謝謝吳軍博士,我聽明白了,您的意思是盡管這個行業目前看上去有些過熱,但是實際上投資按照目前看還是相對理性可控。其實剛才您也提到了關於能源的消耗可能是一個問題,朱教授是著名的碳中和方面的專家,其實也正好把延伸的問題問一下。您怎麽看待,包括剛才彭文生博士的報告中關於,隨著技術的不斷發展,尤其是AI的發展,對能源的消耗反而好像更高了,因為尤其是AI,它反過來創造了更多的人對 AI的發展之後產生的這種額外的新需求。是不是出了AI之後,反而還會減緩碳中和的腳步,因為全球並不是什麽國家都能夠擁有比較好的清潔能源的供給。

朱雲來: 這個問題非常好。其實我正好借這機會給大家提供一個宏觀的基本框架,包括剛才吳博士講,吳博士我知道他做了很多AI的投資,這一方面應該是很專業的,我是從一個宏觀的角度也給大家提供一點這種概念的支撐,這樣就會更容易理解。

我們講到這個是1萬億美金的全世界的投資,就是AI的投資,但實際上全世界的目前大致的水平,GDP的水平是100萬億,平均的投資大概百分之一二十,投資占經濟總量的占百分之一二十,然後中國占的比例比較高,因為中國歷來投資的占比很高,可能到高到40%,GDP的40%是投資,但是從全世界平均來講,就剛才說了一二十,那麽也就是說1、20萬億,100萬億的基礎,其中可能1萬億,而且剛才吳博士也解釋了, 1萬億不是我現在一下投1萬億,這1萬億可能我投了3,000億,在這個過程中間明年產生點利潤,我繼續把利潤的一部份再投進去,這樣累計,我不知道他具體怎麽個演算法,但是總而言之,就算是你全部都拿新的出來投,也不過就是這個比例,應該也不能算多對吧?

然後剛才曙光講到的我們電力的需求,我確實看到很多這種估算,我自己也在試著估算一下,全世界我算了一下,以全世界現有的芯片,它不是有個功率嘛,你比方說多少個芯片,比如說你的芯片是多少幾百瓦,然後我假定你把全世界芯片全部加起來,全部天天都在執行,你要花多少電?

好,我們算下來,初步的估算,一個是5,000億或者到5,000億到1萬億度,這又是一個什麽概念?全世界現在平均總的用電量是30萬億度,中國是差不多將近10萬億度,三分之一,9.5萬億度,所以你按照這個來算的話,那麽它其實是1/30的全世界的電耗。不算小,但也不能說是滅頂之災。

另外我們現在在做的雙碳,就是剛才曙光提到,我們經常也會討論一下這樣的基本問題,我現在認為,就是說至少根據我們的科學的計算,現在我們用光伏基本上加上電池,可以用光伏加儲能的辦法能夠基本上替代,百分之百的替代火電。當然實際的替代過程是透過一個自然折舊的過程,20年,那麽自然就可以把它替代掉。

如果是基於這樣的話,也就是說全世界的這30萬億度電,將來我們全部都可以用光伏來提供,所以它都是綠電,你不用擔心,然後其中大概按你剛才估1/30,當然,我們估計的是現有的芯片,將來你要如果再漲個5倍10倍的話,可能就占比再高一點,但是這個也不是說不可承受。

王曙光: 謝謝朱教授給我們的吃了顆定心丸,3%如果是未來5年double也就是6%,按照中國現在太陽能電池這些大的幾家廠商的產能利用率,如果我沒記錯的話,翻6%正好把他們的產能利用率提高到百分之百,我覺得這個看起來二級市場應該還會有更多的機會去買電池廠商,我覺得這是一個很好的訊息。

另外的話往前看,我還想問吳軍博士,因為全球並不是所有的國家,都有很好的清潔能源的供給,但是3%說大不大說小不小,因為它可能就在邊界上的增加,就會導致一個國家的能源系統其實出現一些問題,因為還包括電網的問題,到底您覺得人工智慧對能源行業的沖擊中短期會是一個什麽樣的情況?

吳軍: 我覺得這不是一個太大的問題。剛才朱教授做了一個已經量化的分析,我再補充兩點。

第一個就是說現在的人工智慧或者說基於這種大模型的人工智慧,大模型實際上全世界就是成規模的也沒幾家,美國有這麽幾家,你一個巴掌基本上,兩個巴掌最多,數出來了,歐洲基本上就法國的一家,然後中國有幾家,加起來,它不會全世界都去,每個國家建一個大模型,這是不會的。就像很多今天的IT服務,你比如說我們的5G標準,你不會每個國家都根據5G標準做交換機的。

這大模型最花錢的是訓練,它又分兩個,一個你把數據變成模型,這叫訓練。 訓練一次我問過Google裏頭的人,大概差不多 Gemini 他們新的版本一次大概是幾億美元,裏頭當然很多是耗的電了,訓練一次他不一定成功,可能訓練廢掉了。像前一陣OpenAI就有一個版本訓練廢掉了,大概差不多10億美元這就打水漂了, 這裏頭很多是電錢。

你真正的用來運算的花的電,就是說來服務花的電沒有那麽多,所以從各個國家來講,你訓練出大模型來講,我估計也就是中國,美國現在還有一個歐洲主要是法國了,這幾個國家訓練出來,包括日本其實都沒有,其他人拿來用了,所以我覺得對電的沖擊不是很大。

第二個現在訓練或是服務,它也不是在個人的電腦上,或者說哪個政府的什麽小的數據中心上,它都是這種超級大的數據中心上,全世界一共也就那麽一些家大公司有,今天數據中心一般要麽建在水庫旁邊,就是水電站旁邊,用的也基本上已經是清潔能源了。再要麽就是像比如說阿裏巴巴,把它建在特別冷的什麽內蒙古這種不太需要空調的地方。總體來講,數據中心在能源的使用上,在今天來講還是相對比較綠色環保的,所以我覺得這個不是一個大問題。哪怕比如你日本要用大模型,你可能也是租亞馬遜的機器,亞馬遜的機器是修在幾個大湖的邊上,用水來冷卻用的水電發電,所以這些我覺得不是一個問題,因為它並不需要每一個國家都來修這個,就是做訓練自己大模型或者修建這種大型的數據中心。

王曙光:好的,謝謝吳博士您的回答這跟剛才朱總的回答確實是給我們很清晰的一個指引,今天最後一個希望分享的問題。目前的全球AI發展其實特別的火熱,但是我們也看到中國的AI面臨著諸多挑戰。一方面就是美國AI的大模型算力芯片和數據品質確實都比中國目前的情況要領先,盡管我們也在大力的發展國內的算力芯片,積極研發自主大模型,期望能夠借助我們的大規模的市場,就像剛才彭博士說的,我們在套用的環境側的機會更多,也希望能夠利用目前政策支持以及互聯網時代積累的這種人工的紅利,然後來實作超越。但是實際上目前我們的產業發展還是受到一些的掣肘,需要更多的資本,人力和物力的投入,在這塊上,在中國人工智慧發展的面臨著這樣的一種挑戰和機遇並存的情況下,從國家層面到底應該如何去應對,包括從行業側怎麽去應對,還是想想聽聽您二位專家的的分享,還是先有請吳博士,請您來分享一下。

吳軍: 謝謝主持人,今天人工智慧發展基本上離不開三件事兒,第一個是算力,第二個是數學模型,第三個是數據,所以從國家層面就是說我們制定人工智慧政策,其實把這三件事做好就可以了。

今天一說到算力或者說芯片,大家都會想到輝達的芯片或者AMD的芯片。實際上最高端的在禁運,次高端的沒有禁運,這兩個差一代,但速度可能差4倍大概。首先這4倍不是太大的影響,就不是那麽致命的。第二個更關鍵的,其實你如果看美國的就是各大公司的使用的芯片,當然輝達的用的是最多的,這沒問題。但是人工智慧這個計算它是一個特定的計算,它不是個通用計算,這也是輝達的芯片比英特爾的芯片更有效的一個原因,就是它是特定的計算。特定計算其實比GPU更有效的是做專用芯片,比如Google他們做的叫TPU就是專門為 test flow做的處理器,就是說做特定運算,它其實單位能耗的計算能力比輝達這種還能高出大概至少一個數量級,大概這樣的, Facebook他們也在做自己的一些芯片。

所以我覺得就是說我們從國家層面來講,除了大家投資做 GPU,現在很多企業在做,需要及早的研制專門針對人工智慧演算法的專用芯片,因為這些專用芯片一旦研制出來以後,他們的單位計算量的能耗是比 GPU高,就是有效的多,就是一個很簡單的例子。就是說大家做的位元幣的計算的時候,一開始是用GPU來做,後來專用芯片來做,這個效率要比 CPU高的差不多兩個數量級了。這是一個。

第二個就是演算法 。演算法今天其實國內大部份大模型用的是 LLaMA ,就是 Facebook,Meta的開源的這一套軟體,這條路我覺得 可以繼續走,但是同時需要就是說這主要是從國家對科研機構的投入,像大學這種來研究,在更基礎的演算法上做更多的研究,而不是簡簡簡單單是說這個直接照搬開源的演算法。因為開源演算法現在只能講笑話,就是說 Facebook半年更新一次,大家就是說和Facebook的差距差半年,如果他得什麽時候兩年更新一次,你不能說這差距反而變成了差兩年。

所以我覺得這不是資本市場的投資,是國家科研經費的投資,對那種基礎演算法的投入。國內現在自主的大模型做的比較好的幾家創業公司,好幾個都是清華的教授和畢業生出來辦的。有一個原因就是說他們對演算法吃的比較透,這是我覺得很重要的原因。還有一個比較好的,比如像阿裏巴巴他們做的比較好,也是因為對演算法本身吃的比較透,所以這是一個。

第三個是數據,國內自己有很多數據,但是在英文世界的數據可能更多,前面兩個主講人其實也提到這一點,我覺得這就講到一個網路的開放,就是說我們還是要構建一個開放的網路,然後盡可能的把全世界的數據都拿回來,這是一個很重要的事情。

大家還有一個忽略掉一件事,就是數據本身原始數據有很多噪音,我們需要做標註等等這些,其實是在國內這是有優勢的,就是說這不僅僅是勞動力成本的便宜,也在於過去我們來管理大規模的人工來做這些事情的時候,以前在做比如說影像辨識的標註等等這些方面的時候,積累了很多的經驗和很多的工具,這個我覺得是一個優勢,這也應該繼續發揮。

基本上今天人工智慧就是這三方面,芯片,然後演算法的數學模型以及數據,投資和國家支持也應該集中在這三個方面。

王曙光: 謝謝吳軍博士。下面請朱總。

朱雲來: 剛才吳博士已經講了很完整,我再稍微補充一點,他提到的三大要素,演算法,數據,算力。

我想特別強調一下演算法,大家肯定也聽到過很多一些討論,比方說開源還是閉源是吧?其實這個演算法裏邊還有一個很重要的,它其實最終是說,還需要一個社會的共識,所以其實最終是連到一個立法問題。比方說你的一個自動汽車自動駕駛,你說起來是個演算法,實際上就是說這個演算法是不是大家公眾都接受的,如果遇到緊急情況對吧?第一選擇什麽,第二選擇什麽,第三選擇什麽。你的整個避撞的順序,其實最終是要摻入很深刻的社會的共識和討論。所以它其實還有一個立法問題,那麽這個數據當然就是說你有足夠大量的數據你才能訓練好的模型,然後你要有這麽多的數據,你沒有足夠的算力是吧?你剛才也提到了關於能源的耗電的問題,剛才說耗電不是大問題,但其實這幾個問題都還是很關鍵。

我另外再想講一個更重要的角度,就是說你發現大模型似乎對社會貢獻很大,至少還是很有用,大家也很有興趣。但是其實它有一個最大的Challenge是什麽?是商業模式。結果但是人家不收費,你只要有一家開始不收費,稀裏嘩啦全都不收費了。剛才說了還有一個平行建設的問題,就是重復投資,我一下10家、8家。中國這個方面投資的家數應該是最多的,在美國也是有10家8家,大家足夠大的公司都得進,還有很多人想進,可能是經濟上也沒法負擔起來,但是收費模式其實是非常難的, 包括從商業角度來講,大家都希望可能閉源,然後希望能夠有一個商業模式能掙錢,但其實這個商業模式是非常困難的。甚至因為它的困難,它變成了最後投資也困難,誰來投資呢?所以它其實商業模式的問題就引出了一個投資模式的問題。

咱們彭文生博士,我們中金研究部的負責人也是研究院的院執行院長,他們的研究講規模效益,你規模效益包括是說你模型的存在是對公眾效益更高,最後可能就需要更多的考慮是帶有公共性的投資的模式,也許是透過公共和公共部門和私人部門的某種協調,來達到這樣一個新的,這種巨型的像社會基礎設施的投資了,然後你怎麽才能平衡在一個合適的點上?既讓參與做的人有足夠的激勵機制,又讓公眾能夠得到絕大的收益,同時又能夠讓這種實戰強度比較高的,相對強度投資強度比較高的,投資活動能夠持續。

彭文生資料圖

然後你從投資的角度,無論你是公共的還是私人的,你最後投資得有足夠的效益。因為我們了解經濟學,金融學,就是說你最重要的如果一個投資永遠沒有收益,就算是你有特別好的公共效益,可能也是無法持續的。

所以我們能做的是既對公共利益有很大的幫助,同時我還有盈利,盈利其實是意味著我們有持續提供這種公共服務的能力,甚至還有繼續增加這種公共服務的能力,它的必要前提就是你還是要盈利。或者說盈利也是我們社會的一個衡量標準,剛才薩金特教授也提到,會計等等這些是一個衡量問題,就是說這是一個完整的一個體系化的考慮。

總而言之,我覺得現在其實我們應該是可以有能力解決系統的發展問題,能夠更好的進一步的推動 AI的發展,以及變成一個普遍可以套用的能提升全社會的 benefit。我甚至認為,我們可以想到,忽然一天我們意識到,你原來也是學電腦相關的是吧?就是說因為我們從一開始一起工作,就會談到,好像20年前的事了,就是說我們有了這樣的一個科技的水平,我們能把這個做得很好。

這個社會其實我們需要的什麽衣食住行,大部份東西我們現在都能生產,而且都能保證足量,甚至我們經常都太過剩了。你只要有一個好的電腦管理的程式,實際上可以把這個事情都安排好,你有合適的收入,你有合適的保障養老對吧?

這一切透過科技的實作的話,包括過去講那麽多什麽數位經濟了,因為它實際上還是提高了我們對整個經濟過程中間的細節的了解和系統的統計,使我使得我們的整個管理更有效,這樣我們可以希望 不是說怕被AI替代了,是說你趕緊早點把我們都替代出去,這樣我們就可以去享受生活 ,然後我們的機器系統可以產生出足夠的供應,每個人都可以,那就是我們基本上是屬於共產主義的感覺了,對吧?時間所限我就先講這麽多。

王曙光: 感謝朱總描繪,包括吳博士給我們描繪我們面臨的挑戰,以及其實我們也不需要那麽焦慮對吧?

因為實際上只要透過足夠的投資,充分多的人才進入這個領域,我相信AI改變社會改變世界應該是在座所有同事的共識,但是我們更期待的是說在這樣一個大的大潮之中,我們能夠抓住機會做出好的投資,然後無論是企業還是投資人都能夠透過這樣的投資,我們在明年大會再開的時候,我們會發現我們周邊有有更多的透過投資創造了價值,並且分享價值,獲得成功的故事。

再次感謝兩位嘉賓的精彩和坦誠的分享,希望對今天台下的所有的朋友你們的時間有所幫助,謝謝。■