當前位置: 華文世界 > 科技

谷歌、微軟包下核電廠「囤電」,AI技術之外的困境被低估了

2024-10-18科技

文| 商隱社,作者 | 浩然

AI的發展給人們描繪了科技進步帶來的「詩和遠方」,但這背後卻有著巨大的能源、資源、勞動力消耗,這是AI發展的沈重現實。

此外,AI作為一種新型「巨機器」對人和社會的影響也被低估了。

01

谷歌在本周一表示,與 Kairos Power 公司簽署一份從多個小型模組化反應堆購買電力的協定,以滿足發展人工智能的用電需求。

谷歌計劃買六到七個小型模組化反應堆的電力,總計500兆瓦,首個小型模組化反應堆在2030年之前投入使用。

而在上個月月底,微軟和星座能源公司簽署了一份為期20年的電力采購協定,計劃重新開機曾因嚴重核事故而關閉的美國三哩島核電廠。

1979年3月28日,三哩島壓水堆核電廠的二號反應堆由於冷卻系統失靈,造成62噸的爐心熔毀事故,這是人類核能發展史上發生的第一起爐心熔毀事件。

國際上把核電廠事故分為7級,切爾諾貝爾和福島的核事故是唯二的兩件7級事故,而三哩島核泄露處於第5級。

星座能源在1999年買下了一號反應堆,就在發生事故的二號反應堆旁邊,後來因為經濟效益不好在2019年關閉了。

跟微軟簽協定後,星座能源將投入16億美元對一號反應堆進行翻新,預計到2028年才開始重新發電,時間表受到監管批準的影響。

谷歌、微軟搬出來核電廠,一下子囤這麽多電,主要將用來驅動AI數據中心。而且不只這兩家,其他在AI領域布局的科技大佬都在這麽幹。

今年3月,亞馬遜從塔倫能源公司購買了一個內建核電供應的數據中心園區;甲骨文最近也表示,正在設計1處由3個小型核反應堆供電的數據中心。

科技巨頭之所以搞得這麽大,是因為AI恐怖的耗電量。

AI究竟有多耗電?

史丹佛人工智能研究所釋出的【2023年人工智能指數報告】顯示,OpenAI的GPT-3單次訓練耗電量高達128.7萬度,相當於3000輛特斯拉Model Y跑滿32萬公裏的耗電量。這也是120個美國家庭1年的用電量。

這還只是訓練用的電,相比後面不斷使用的環節只是小頭。

在使用環節,AI每次作出回應也要大量耗電。像ChatGPT有2億多使用者,每天響應這些需求就要耗50萬度電。

大模型的參數量越大,需要處理的數據就越多,所需要的計算量就越大,而算力背後是大量的伺服器、儲存器材和網絡器材,它們日夜不停地工作,消耗大量電能。

曾有業內人士表示,國內一線大模型的營運成本中,電費占到了總成本的50%以上。

國際能源署今年釋出的報告中預測,未來三年全球對數據中心、加密貨幣和人工智能的電力需求將增加一倍以上,相當於一個德國的全部電力需求。

「我在一年多前就預測過芯片短缺,下一個短缺的將是電力。我認為明年將沒有足夠的電力來執行所有的芯片。」前段時間馬斯克發出了這樣的預警。

OpenAI行政總裁山姆·柯曼也表示,人工智能將消耗比人們預期更多的電力。

如果說算力是大模型的底層支撐,那電力就是算力的底層支持。能否獲得更清潔、穩定的能源,以及AI器材能否做到效率更高、更省電,影響著AI發展的可持續性。

02

除了耗電,AI對資源也有著大量消耗。

比如對水資源的消耗。AI芯片制造過程中涉及大量的清洗和化學處理步驟,生產一個智能電話芯片就需要大約消耗5噸多的水。而AI超算數據中心也需要大量水來散熱,研究發現,單是使用GPT-4生成100字文本就需要消耗多達三瓶水。

有調研估算,到2027年,全球範圍內的AI需求可能需要消耗掉66億立方米的水資源,相當於杭州西湖水量的450多倍。

還有礦產資源,任何高科技的起點都是能源和礦產。

從網絡路由器到電池再到數據中心,AI系統擴充套件網絡中的每一部份都需要礦產資源。

現代生活的很多方面都被轉移到了「雲端」,但人們很少考慮這些原材料的成本。我們的工作、生活、閑暇娛樂大部份都發生在網絡計算架構的世界,而由雲端運算聯通的我們拿在手中的器材,其內核為鋰。

可充電鋰離子電池是流動通訊器材、筆記電腦、家用數碼助理和數據中心備用電源的必需品。它們支持著互聯網和互聯網上執行的幾乎所有商業平台。

除此之外,還有很多不可再生的礦物質參與到了AI和其他高科技發展中,包括用於iPhone喇叭和電動汽車電機的稀土元素鏑和釹,用於士兵的紅外軍事器材和無人機的鍺,可以提高鋰離子電池效能的鈷。

參與世界科技競爭的國家都會根據自身工業要求和對供應風險的戰略評估,制定自己的關鍵礦物清單。

中國、美國、歐盟戰略性關鍵礦產(圖源:國際合作中心網站)

鋰、鍺、鈷、稀土、石墨等都位列其中,是發展新能源汽車、人工智能、雲端運算、光伏、資訊通訊等高科技不可或缺的。

像稀土,裏麪包含17種金屬元素,16種被用在了智能電話裏,這些元素可以在彩色顯示器、喇叭、相機鏡頭、可充電電池、硬碟機和其他許多元件中找到。

如果無法保證這些礦物的供應,包括AI在內的科技行業都將陷入停滯。這是技術發展最重要的約束條件。

很多礦產都分布於世界上比較偏僻或者經濟不發達地區,像玻利維亞西南部的烏尤尼鹽沼、剛果中部、蒙古國、印度尼西亞。而采礦歷來都是一件極易引發地緣政治沖突和戰爭的事情。

但包括AI在內的高科技發展給我們帶來了「詩與遠方」,很容易讓我們忽略構成技術「肉身」的這些原材料,背後的稀缺,以及由此帶來的沖突、饑餓和貧窮。

正如「鋰電池之父」古迪納夫所擔憂的那樣:「鋰的重要性不亞於石油等戰略性資源,一旦開采出現瓶頸,可能會跟石油一樣成為戰爭的導火索。」

這樣看來,高科技幾乎也可以看作是一種資源密集型的提取技術,把不可再生的礦產、水等轉化一些虛擬能力,期間還伴隨著環境破壞和地緣沖突。

而且,這種巨大的資源密集型基礎設施幾乎完全是私人的。

03

AI發展不僅存在能源和資源「饑渴」,還存在數據「饑渴」。

數據、演算法和算力是AI大模型的三大支柱,而數據是大模型進行訓練的根基。數據集塑造了AI的認知邊界,它們決定了AI「看」世界的界限。

比如,建立電腦視覺系統的第一步,通常是從網上抓取成千上萬甚至數百萬張影像,然後建立一系列分類體系來對它們進行排序,並以此作為系統感知可觀察事實的基礎。

如果想構建一個可以檢測蘋果和橙子圖片之間差異的機器學習系統,首先開發人員必須收集和標記數以千計的蘋果和橙子的影像,並基於此訓練神經網絡。在軟件方面,演算法會對影像進行統計調查,並開發一個模型來辨識兩個「類別」之間的差異。

如果一切按計劃進行,經過訓練的模型將能夠區分它以前從未遇到過的蘋果和橙子影像之間的差異。

但如果所有蘋果的訓練影像都是紅色的,而沒有一個是綠色的,那機器學習系統可能會推斷「所有蘋果都是紅色的」。青蘋果完全不會被辨識為蘋果。

因此,訓練數據集是大多數機器學習系統進行推理的核心。它們是AI系統用來生成預測基礎的主要原材料。

現在網絡上每天有不可勝數的文本、圖片、音影片被上傳,AI參與者就開始了數據掠奪。

科技巨頭在其中占據了優勢地位,像騰訊、字節、Meta等掌握著各自的數據渠道,分享內容的人越多,他們能用來訓練大模型的力量就越大。人們很樂意免費為他們的照片貼上姓名和地點的標簽,而這種無償勞動為機器視覺和語言模型系統帶來了更準確的標記數據。

沒有這些數據渠道的企業就要為此付一大筆費用或者想其他辦法得到。

OpenAI就曾被報道其在未得到創作者授權情況下,使用Whisper語音辨識工具,轉錄了超過一百萬小時的YouTube影片內容,並將這些數據用於訓練其GPT-4模型。

但數據,尤其是高質素的數據並非取之不盡的。根據去年Epoch AI人工智能預測組織的一項研究,AI公司可能在 2026年前耗盡高質素文本訓練數據,而低質素文本和影像數據的枯竭時間可能介於2030年至2060年之間。

山姆·柯曼曾認為AI最後應當可以產生高品質的「人造資料」,以便高效地進行自我培訓。

但很多研究者認為,AI產生的數據質素太差,再用這樣的數據「餵」自己就是「自我投毒」。

對高質素數據的饑渴催生了「AI錄音員」「大數據標註師」「AI編輯」等眾包工作。

之前就有媒體報道,在一些一二線城市,互聯網大廠正以每次300元的價格,招募「AI錄音員」。他們的任務是為大模型提供客製化的語音數據,透過錄制長達3小時的對話,幫助AI更好地理解和學習人類語言。

這300元不是那麽好掙的,需要提供有充足劇情、嚴格符合規範的高質素內容,可能需要多次重復一些內容以符合要求。

事實上,AI的一個常被忽視的重大事實就是需要數量巨大的低薪工人幫助開發、維護和測試AI系統。比如AI錄音員,還有給數千小時的培訓數據做標記,審查可疑或有害的內容。但他們從未因為使這個AI系統正常執行而獲得認可。

此外,像亞馬遜的物流系統,即便配備了大量機器人來做諸如搬箱子這樣的重活,但也需要人來配合完成機器人做不了的特殊、精細的工作,比如機器人辨識不了的奇形怪狀的東西。

人去配合機器人,就要不斷適應機器人,還要按照機器的節奏,很難運用自己已有的知識或形成工作慣性。

這顯示出了AI發展初期人的改造,把人的勞動和價值之間進行脫節,從而更好地配合機器,也更容易被替代。

而AI大多數訓練集是在人們不知情或未經當事人同意的情況下構建的,像家裏的智能音箱、口袋裏的手機、智能手錶、監控記錄下的面部表情等,會不會也被拿來作為數據訓練AI?

機器學習模型需要持續的數據流才能變得更加準確。但機器只能漸近,永遠不會達到完全精準,這進一步推動演算法從盡可能多的人身上提取資訊,來為人工智能提供「燃料」。人類主體性被進一步消解。

04

寫下這麽多並不是「反技術」,恰恰相反,技術給人類帶來了諸多便利,創造了更多可能性,使人類擺脫了諸多生存和發展難題。

但技術背後是一個涉及能源、資源、人、社會、歷史等各方面的系統性問題。

正如社會學家凱特·哥羅福在其所著【技術之外:社會聯結中的人工智能】中認為,人工智能既是具身的,也是物質的,由自然資源、燃料、人力、基礎設施、物流、歷史和分類構成,這些都是需要付出代價的。

但很明顯,當下人們更多追求技術的軍備競賽和技術狂歡,而忽略了技術之外的一系列問題。

尤瓦爾·赫拉利在【今日簡史】裏說,19世紀工業革命興起之後,當時的社會、經濟和政治模式都無法應對相關的新情況和新問題。封建主義、君主制和傳統宗教不適合管理工業大都市、幾百萬背井離鄉的工人,並面對現代經濟不斷變化的本質。

狄更斯筆下的煤礦童工、第一次世界大戰和1932—1933年的烏克蘭大饑荒,都只是人類付出昂貴學費的一小部份。

現代文明有核武器及各種更高級的技術,破壞力也更驚人,我們只能比面對工業革命時做得更好才行。

人類的行進既充滿智慧,又是盲目的。做任何事都有代價,或許最優的結果是效果和代價匹配,而非不計代價地奔向目標。