當前位置: 華文世界 > 科技

黃仁勛:機器學習的關鍵在於「飛輪」,輝達不談論市場份額

2024-10-15科技
目前全球到底需要多少算力?輝達是否追求擴大市場份額?
近日,黃仁勛在一次長達約1個半小時的訪談中,談及自己對於AGI(通用人工智慧)、機器學習、AI(人工智慧)未來的看法,並對馬斯克、xAI、OpenAI和自己的工作生涯作出了評價。
黃仁勛表示,AGI很快會以某種形式成為個人的「口袋助手」,這個助手一開始它會很有用,但不會是完美的,隨著時間推移,它會越來越完美,就像所有的技術一樣,這也是科技的魅力所在。
黃仁勛 視覺中國 資料圖
「我們重新發明了計算」,機器學習的關鍵是飛輪效應
黃仁勛表示輝達「重新發明了計算」,過去十年裏將計算成本降低了10萬倍,遠超過莫耳定律所能帶來的百倍。
他認為,加速計算、新的數值精度、新的架構以及極其快速的記憶體等創新,都推動了算力的飛速發展,也讓我們從人類編程走向機器學習。同時,機器學習的速度也很快,隨著重新定義計算的分布方式,輝達引入了各種形式的平行計算,變得擅長在這些基礎上發明新的演算法和訓練方法。這些技術和創新互相疊加,最終帶來了令人難以置信的進展,「整個堆疊都在增長,我們在所有層面上進行創新,因此我們看到了前所未有的擴充套件速度……以前我們討論的是預訓練模型的擴充套件,每年模型的大小和數據量翻倍,算力需求也因此每年增加四倍,而現在我們在後訓練和推理階段也看到了擴充套件,預訓練再也不被視為艱難,推理也變得復雜,把所有人類思維都視為一次性是荒謬的,快速思考和深度推理、反思、叠代和模擬,這些概念現在都已經開始顯現。」
黃仁勛強調,很多人過去認為,包括現在還有很多人認為,設計一款更好的芯片,就是擁有更多的算力,更多的浮點運算能力。算力確實很重要,但這種思維方式已經過時,因為過去的軟體都是在系統上執行的,是靜態的,也就是說提升系統效能的最好方法就是做出更快的芯片,但我們已經進入機器學習,而非人類編程了,不僅僅是軟體,更要涉及整個數據處理過程。機器學習的關鍵是「飛輪效應」,我們要考慮的是如何讓「飛輪」高效運轉。很多人甚至都沒有意識到,光是數據整理和訓練都需要AI,這個過程本身就非常復雜。而正是因為有了更智慧的AI來整理數據,現在有了合成數據生成以及各種不同的數據整理方式。因此,在進行訓練之前,已經有大量的數據處理工作。所以當考慮這個飛輪時,應該從整體來看待,而不僅僅是關註訓練,應該設計一個計算系統和架構,能夠讓這個飛輪每一步都盡可能高效,而不僅僅是特定套用場景的訓練。
黃仁勛稱:「訓練只是其中一步,每一步都是艱難的,機器學習沒有任何容易的部份。無論是OpenAI,還是DeepMind的Gemini團隊,他們做的都不是簡單的事情。所以,你應該關註整個過程,加速每一個步驟,尊重阿姆達爾定律。如果某個步驟占用30%的時間,即使加速三倍,整體過程的提升也有限。所以,關鍵是建立一個可以加速每個步驟的系統,這樣才能真正提高迴圈時間和整個飛輪的效率。」
他認為,飛輪和學習的加速最終會帶來指數級的提升,輝達的整個過程也都是透過CUDA加速的。
推理的增長將達到億倍規模,輝達「從不談論市場份額」
對於輝達的「護城河」,黃仁勛強調,輝達的優勢在於演算法,以及上層科學和底層架構的深度融合,他相信公司在推理方面的「護城河」會像在訓練方面一樣深厚。
他認為,訓練實際上就是大規模推理,如果在特定架構上完成了良好的訓練,那麽推理過程也會表現優異,如果在這個架構上構建它,即使沒有特別的考慮,它也會能在這個架構上執行。因此,架構的相容性對於推理任務至關重要,就像iPhone和其他裝置一樣。
同時,輝達目前40%以上的收入來自推理,推理方面即將因推理鏈的出現而大幅增長,黃仁勛表示是一場智慧生產的革命,推理的增長將達到億倍的規模,「這就像上學是為了將來在社會中有所貢獻,訓練模型很重要,但最終的目標是推理」。
黃仁勛表示,輝達的目標是建立一個無處不在的計算平台,「我們每年都在努力創造一台新的電腦,其效能提升兩到三倍,成本降低兩到三倍,能源效率提高兩到三倍。這種進步令人難以置信。因此,我們建議客戶逐年分批購買新裝置,以維持在成本上的平均水平,這樣做的好處是在架構上保持相容性。
黃仁勛稱,目前以公司的改進速度來構建單獨的系統是非常困難的,同時還有一個難點在於,輝達不僅僅將這些創新作為基礎設施或服務出售,而是將它們分解並整合到多個平台中。因為每個客戶的整合需求都各不相同,我們必須將所有的架構庫、演算法和框架整合到他們的系統中,當然也包括我們的安全系統和網路。我們基本每年都要進行大約10次整合操作。這真是個奇跡,但這也讓我感到瘋狂,想想這件事我就快要瘋了」。
而對於市場,他表示輝達不想從任何人那裏搶奪市場份額,「如果你看我們的ppt,會發現我們從不談論市場份額。我們內部討論的都是如何創造下一個事物、下一個可以在飛輪中解決的問題是什麽、如何更好地為人們服務、如何將過去可能需要一年的飛輪縮短到一個月……在考慮這些事情的同時,我們確信我們的使命非常獨特。唯一的問題是這項使命是否必要……所有偉大的公司都應該以使命為核心,關鍵在於你在做什麽,以及這是否必要、是否有價值、是否具有影響力和幫助他人。」
如何看待OpenAI和馬斯克,是否需要百萬張規模集群?
對於OpenAI,黃仁勛認為是這個時代最具影響力的公司之一,是專註於AI、致力於追求AGI願景的公司,ChatGPT的問世標誌著人工智慧的覺醒,「我非常欣賞他們的速度以及推動這一領域發展的獨特目標」。
當被問及馬斯克和xAI,黃仁勛也不吝誇贊,他表示在19天內搭建完成一個10萬張GPU集群,一個采用液體冷卻、通電並獲得授權的巨大工廠,「據我所知,世界上只有一個人能做到這一點,那就是埃隆」。同時,他也表示,現在已經進入擁有20萬-30萬塊GPU集群的時代。
那麽集群是否需要擴充套件到50萬張甚至100萬張的規模?黃仁勛的回答是:「如果看擴充套件能力,進行簡單數學計算,再加上每年模型大小和算力的四倍增長,再結合增長的使用需求,你會發現,我們需要上百萬塊GPU,這是毫無疑問的。但問題是,我們如何從數據中心的角度進行架構設計?這與數據中心的規模密切相關,比如是以千百萬瓦還是250百萬瓦為單位?我覺得會是二者兼而有之……所有正在進行的模型並列和分布式訓練的突破,所有的批次處理等,都是因為我們在早期做出了努力,現在我們正在為未來進行早期的工作。」
對於開源閉源的問題,黃仁勛表示這與安全相關,但不完全關乎安全。「沒有什麽問題是因為閉源模型導致的,這些模型可能是商業模式的引擎,它們是推動創新所必需的,我對此完全支持。重要的是,不應是對立,而是並存」。他贊同開源對於許多行業是必不可少的,使得金融服務、醫療保健、交通運輸等領域帶來巨大潛力。
對於開源,黃仁勛打了一個比方:「我的想象是,如果你把一個超級聰明的人關在一個有緩沖的房間裏一個月,出來的可能並不會是一個更聰明的人。但是,如果有兩三個人坐在一起,透過交流、討論、相互質詢,所有人都可能變得更聰明。所以,AI模型之間的互動、爭論和強化學習,以及合成數據的生成,這些概念是合理的。」
沒指望工作永遠有趣,自己每天都在使用AI
在采訪的最後,黃仁勛也對自己和行業表達了看法。他表示:「我不認為我們工作的全部都是有趣的。我的工作並不總是有趣的,也沒指望它永遠有趣。你問我這是不是我的期望,我會說這工作是重要的。我不太看重自己,但我非常認真對待工作、責任和在這個時代的貢獻……和家庭、朋友、孩子這些一樣,他們不總是有趣的,但我們總是深深地熱愛它們。」
他認為真正的問題是,他還能保持多長時間的相關性。他表示自己每天都在使用AI,即便知道答案也會用AI再檢查下,以發現新的內容,「AI作為導師、助手,作為一起頭腦風暴的夥伴,檢查我的工作,它徹底顛覆了一切。這對於資訊工作者而言是一場革命。我希望能保持這種相關性,繼續作出貢獻,因為這項工作對我來說非常重要,我想繼續追求。我對目前的生活品質感到難以置信,並無法想象錯過這樣的時刻。」
澎湃新聞記者 秦盛
(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)