當前位置: 華文世界 > 科學

為什麽化學家對百億億次計算如此興奮

2024-01-25科學

by Craig Bettenhausen , Mark Feuer DiTusa

在橡樹嶺國家實驗室,一台名為「Frontier」的超級電腦打破了百億億次的計算障礙,這意味著它每秒可以計算超過一百萬萬億次的浮點運算。在這一集中,C&EN記者Craig Bettenhausen和Ariana Remmel討論了Frontier是如何工作的,以及這種能力對計算化學意味著什麽。

C&EN揭秘是C&EN播客「 Stereo Chemistry 」的一個新計畫,它對最近封面故事中的主題進行了更深入的研究。請閱讀Remmel於2022年9月5日發表的封面文章,內容是bit.ly/3RkPjr6上的百億億次計算。

Stereo_Chemistry_Uncovered_exascale_computing ,凱算計算,17分鐘

現在就在Apple Podcasts, Spotify或任何你收聽播客的地方訂閱Stereo Chemistry吧。

以下是這一集的文字記錄。為了篇幅和解析度,采訪經過了編輯。

Craig Bettenhausen: 歡迎來到C&EN揭秘。我是Craig Bettenhausen。C&EN揭秘是我們在Stereo Chemistry上嘗試的新東西。在每一集中,我們將深入了解化學與工程新聞最近的封面故事。C&EN精明的化學記者將分享他們報道中的驚人時刻,他們最大的收獲,以及在剪輯室地板上留下的東西。在這一集中,我們將深入研究去年9月的一個封面故事,關於百億億次計算及其對化學的意義。我和Ariana Remmel在一起,他寫了那篇文章。嗨,Ari!

Ariana Remmel: 嘿,Craig。感謝大家邀請我做客播客。

Craig: 我們將在這一集的節目說明中連結到那篇文章,或者你可以在9月5日的C&EN印刷版上找到它。那是2022年9月5日。如果你還沒看過,一定要去看看。但是我認為一個好的開始,Ari,是讓你解釋一下什麽是百億億次計算。這是一個大而可怕的詞,在我讀到這篇文章之前,我對它也很陌生。

Ariana: 所以,我在C&EN的職責是確保我們的聽眾了解物理化學,計算化學,天體化學的最新發展。百億億次電腦,是新一代的超級電腦,實際上很適合我已經寫過的故事。

所以,化學家們使用超級電腦的時間和超級電腦出現的時間一樣長。這些系統能夠進行大量的計算,它們的計算能力是以每秒浮點運算次數為單位來衡量的,浮點運算基本上是一種奇特的計算演算法,可以處理,比如科學記數法,小數點可以移動的數位。所以,一台標準的膝上型電腦每秒可以進行數十億次計算,這就是為什麽我們的膝上型電腦可以處理所有這些標簽。這麽多標簽。這也是為什麽它們可以幫助渲染非常可愛,清晰的顯示,影像,並幫助我們視覺化分子。

但如果我們真的試圖在電腦上研究和模擬一個復雜的分子系統,你需要更多、更多的計算能力。所以,在化學家的超級電腦領域中,傳統的電腦已經能夠進行數萬億次的計算,呃,可以實作數萬億次的浮點運算,也就是每秒浮點運算。

Craig: 這是一個偉大的名字。

Ariana: 這絕對是一個有趣的詞。現在,在美國,最強大的超級電腦實際上是在千萬億次浮點運算的範圍內,它每秒可以進行超過一千萬億次的計算。以Summit為例,它是橡樹嶺國家實驗室一台每秒千萬億次浮點運算的電腦,這台電腦每秒可以進行200千萬億次浮點運算。這是一個驚人的能力,在某種程度上,這台超級電腦被用來執行很多計算,這些計算進入了現在標誌性的SARS-CoV-2病毒包膜模型,我想,我敢打賭,我們的觀眾在這一點上已經在互聯網和各種新聞出版物上看到了。

所以,所有這些都是為了建立一個事實,那就是百億億次電腦,在美國,第一台新的百億億次電腦現在被稱為「Frontier」,也在田納西州東部的橡樹嶺國家實驗室,這台電腦將比「Summit」強4到5倍。這是因為它可以做到,它已經打破了每秒百億次浮點運算的障礙,它每秒可以進行一百億億次的計算。這是10^18,絕對是驚人的。

Craig: 這個問題可能是在棒球內部(在美國俚語中,「棒球內部」一詞指的是只有專家、內部人士和愛好者才感興趣或欣賞的系統的細節和詳細的內部運作。),但這些是一些瘋狂的話,我只是有點…你花了多長時間來理解這些千萬億次和百億億次浮點運算和這個…(笑聲)

Ariana: 是啊,不,這很公平。

我想說的是,讓我在這個故事中徹夜不眠的很多事情都是為了核實事實,以確保我在所有這些數位中都有正確的零數量。現在,我認為很多這些術語,對於大多數化學家來說,在我們的日常計算中可能沒有那麽重要。

然而,了解硬體及其功能背後的驚人創新水平對化學家來說非常重要,你知道,當我們開始套用這種新型儀器,百億億次超級電腦,深入研究化學系統的復雜性時,化學科學將開啟什麽樣的大門,這些復雜性是我們無法獲得的,或者是在我們之前的早期模型中無法看到的。

Craig: 是的。我們來討論一下這個問題,因為你提到了蛋白質和脂質以及COVID-19顆粒之類的東西。

你可以想象,你需要很多的計算能力來模擬蛋白質的彎曲,扭曲和擠壓,但是在化學世界裏,除了蛋白質和脂質人群,還有誰需要這樣的東西呢?

Ariana: 是的,所以,當你試圖了解化學系統中的物質,化合物是如何運動的時候,你知道,這些分子動力學模型,部份用於模擬SARS-CoV-2病毒粒子,這些將是非常重要的。

Craig: 聽起來你說的其中一件事是除了能夠模擬更復雜的系統之外,它還能讓我們模擬系統我們可能已經在一個模型上了,但是要模擬一個更長的事件。

Ariana: 是的。這個更長的時間框架讓很多科學家非常非常興奮,特別是在生化領域,因為如果我們真的想要能夠建立生物系統的受控計算模型來真正提出問題,你知道,在我們的實驗設計中發生了什麽,實驗結果在做計算研究時仍然非常重要,因為你有一個基準,對嗎?你需要知道你正在研究的東西是真實的。如果不是,你可以做一些改進。但在現實生活中,在生命系統中,這些反應發生在更長的時間尺度上,這是由於有限的計算能力而無法實作的。

Craig: 所以除了化學家,還有誰在這台機器上競爭時間呢?這是真的,我們沒有獨家存取權。

Ariana: 不,我們絕對不需要。我之前提到的Frontier是第一個在美國首次亮相的百億億次電腦,也是三個預計將真正投入使用的電腦中的第一個,在2023年的某個行事曆年向公眾開放。另外兩個系統,伊利諾州阿貢國家實驗室的Aurora和加州勞倫斯利佛摩國家實驗室的El Capitan,這兩個系統也將很快上線。你會註意到這三個實驗室都是能源部的國家實驗室。有了這種計算能力,人們對尋找更節能的催化劑非常感興趣,當然是在化學領域,但也能夠研究亂流,研究宇宙膨脹,這些物理和能源系統中的其他大問題也需要同樣多的計算能力。

所以,我知道有很多宇宙學領域的人非常興奮地使用這些百億億次電腦來嘗試看看我們是否可以建立宇宙起源的模型並嘗試真正深入到宇宙如何膨脹的一些基本細節。

Craig: 你去過那裏,你去過這個設施。在這個超凡脫俗的地方是什麽感覺?

Ariana: 所以我從阿肯色州的小岩城開車到田納西州的橡樹嶺,就在諾克斯維爾往北一點,在這個州的東部邊緣。這是美麗的山地景觀,有郁郁蔥蔥的綠樹。嚴格來說,它不是阿巴拉契亞山脈的一部份,但它離大煙山國家公園不遠。

所以這裏的風景非常美。為了真正到達橡樹嶺,就像你必須…首先,你必須透過安全檢查才能透過大門。所以,我去了,給了他們我的身份證。但我的建議是繼續走下去,當你到達那裏的時候你就知道了,你知道,在這種多山的山谷裏絕對是美麗的。但是橡樹嶺,真正的校園,真的很漂亮,它看起來很像一個標準的研究型校園。但是我采訪過的其中一個訊息來源,布朗森·梅塞爾,他是橡樹嶺領導計算設施的科學主任,他說,是的,如果你看看這些建築,很多都是在20世紀40年代建造的,當實驗室最初建立的時候。但是計算設施看起來像是,蒸汽龐克式的改造,因為所有這些,就像,你知道,他們對它做了一些管道和改造,以確保他們能容納所有這些電腦,為它們供電,儲存它們,這實際上有點瘋狂。

走進去有一個很酷的觀景台,人們可以往下看,就像玻璃窗,你可以往下看這個白色的大房間,在你的正前方,是Frontier的第一個櫃子。上面寫著"Frontier"兩個大字。這樣你就知道你在看什麽了。工程師們在這些櫃子裏進進出出,或者在這些櫃子周圍移動。一共有74個,每個都重約8000磅,部份原因是裏面的元件數量太多了,而且,你知道,因為它每分鐘要泵送6000加侖的冷卻水。所以它們非常非常重。他們要做的一件事就是,加固地板以確保地板能夠承載所有的計算能力。

當我7月份去參觀這個設施時,工程師和設施管理人員仍在努力「擺脫節點」,對,他們需要能夠……我的意思是,想想這個事實真的真的很有趣,就像,這台機器裏有這麽多部件,可能會出問題,對吧?所以他們必須確保每一個元件都能正常工作。

但真正讓我吃驚的是,你知道,當部件失效時,它們往往在機器壽命的開始階段就失效了。

這就是為什麽他們需要確保他們在一開始就做了很多工作來檢查所有不同的硬體位。當我在那裏的時候,有一個工程師坐在一個小板凳上,拿著一把螺絲刀,把這些創新的部件重新拉出來,把它們拿出來,再放回去。他還帶了一小瓶異丙醇來幫助清理。這有點令人驚訝,對吧,回憶起來,就像,就像,在一個房間裏,建造和設計這台機器的人之間有著清晰的聯系,就像,從中產生的不可思議的科學。

我想我和橡樹嶺的人談論的其中一點是一開始我很糾結,好吧,我該把Frontier叫做機器還是樂器?當然,按照電腦就是機器的標準,它絕對是一台機器,但我交談過的大多數研究人員都對這些超級電腦的使用者將如何使用它們感興趣,對吧?所以從這個角度來看,把它看作是科學家的一個工具而不是一個能夠自我產生科學突破的東西。你知道,真的是人們將這個超級計算的新時代帶入現實。

Craig: 是的。這個搖出的節點讓我想起,當我參觀哈佛的科學史博物館時,他們有一個早期的,我的意思是,這是一個超級電腦。它沒有現在的袖珍小算盤那麽強大,但它描述了,你知道,捕捉蟲子,在那個時候,蟲子真的會被放進機器裏,真的會被困在裏面。

Ariana: 是啊,太瘋狂了。我不認為【Frontier】有任何漏洞。我的意思是,這是一個非常幹凈的空間,你知道,有點像科幻級別的白色房間,這台電腦的黑色巨石只有微弱的嗡嗡聲。裏面其實很安靜,我覺得這很了不起。我不知道有什麽漏洞。我確實試著算出有多少個螺絲,但是沒人,我,我沒能得到一個好的答案。你知道,這個邊境和其他DOE exascale電腦計劃投產都稱為exascale電腦計畫的一部份,成立於幾乎超過5年前,對,所以這一事實FrontierCOVID期間能夠得到安裝,它是保存在時間表,這真的超出預期在很多不同的方面,考慮到短時間內從提案到實際執行,也很了不起。

Craig: 那麽,在這些大型電腦領域,你下一步的目標是什麽?

Ariana: 是的。我的意思是,我認為有很多非常有趣的問題,我期待著去了解。我們如何使用人工智慧和機器學習來簡化化學家感興趣的一些計算任務的一些基礎知識。我知道這裏有很多術語,但是為了教會電腦哪怕是化學直覺的基礎知識這些都是我們在化學課上學到的所有基礎化學課程加上我們在實驗室的時間,為了讓電腦學會這些,它們需要大量的數據集才能開始建立聯系,這就是機器學習的工作方式,對吧?如果你想想像戴爾- e2這樣的系統,甚至是克雷恩,這些在社交媒體上走紅的人工智慧影像生成工具,就像,這些技術通常是用數百萬張帶標簽的影像開發的,對吧?所有這些不同的參數。我們現在還沒有達到,第一,我們甚至有化學系統的數據集有足夠的參數,但我們也沒有能力處理所有的數據,以一種機器學習演算法可以真正嘗試開始建立聯系的方式,這樣它就可以在一個從未見過的系統上「自己思考」。因此,擁有的能力來訓練這些演算法可以來自experimentation-which的更大的數據集,你知道,exascale電腦將把需要,但是也能夠訓練他們的exascale電腦,因為他們可以讓機器學習所有不同的節點,它需要建立這些聯系是要給我們存取演算法,將很可能在其他領域的實用化學,對吧?因此,我認為,這是一個讓我興奮的地方,看到百億億次計算的突破如何對化學家產生直接影響,他們可能永遠不會在前線或任何其他能源部的超級電腦上進行實驗。

Craig: Ari,非常感謝你花時間告訴我們這一切。

Ariana: 是的,非常感謝你和我談論這個故事。這非常令人興奮。請線上檢視完整版本,如果想了解更多更新,你可以在Twitter上關註我:@science_ari。

Craig: 同樣,你可以在C&EN的網站或2022年9月5日的C&EN印刷版上找到Ari關於百億億次計算的封面故事。我們在節目單上加上了連結,並附上了劇名。你可以在社交媒體上找到我@CraigOfWaffles。

這就是C&EN揭秘,C&ENStereo Chemistry的新系列。Stereo Chemistry是化學與工程新聞的官方播客。C&EN是由美國化學會出版的獨立新聞媒體。

謝謝你的聆聽。

更正:該記錄已於2023年2月2日更新,以準確反映集錄音中描述的單位百億億次浮點運算的度量。每秒的百億億次計算是10^18,不是1018。

原文連結:

https://cen.acs.org/physical-chemistry/computational-chemistry/Podc ast-chemists-excited-exascale-computing / 101 / web / 2023/01