当前位置: 华文世界 > 科学

为什么化学家对百亿亿次计算如此兴奋

2024-01-25科学

by Craig Bettenhausen , Mark Feuer DiTusa

在橡树岭国家实验室,一台名为「Frontier」的超级计算机打破了百亿亿次的计算障碍,这意味着它每秒可以计算超过一百万万亿次的浮点运算。在这一集中,C&EN记者Craig Bettenhausen和Ariana Remmel讨论了Frontier是如何工作的,以及这种能力对计算化学意味着什么。

C&EN揭秘是C&EN播客「 Stereo Chemistry 」的一个新项目,它对最近封面故事中的主题进行了更深入的研究。请阅读Remmel于2022年9月5日发表的封面文章,内容是bit.ly/3RkPjr6上的百亿亿次计算。

Stereo_Chemistry_Uncovered_exascale_computing ,凯算计算,17分钟

现在就在Apple Podcasts, Spotify或任何你收听播客的地方订阅Stereo Chemistry吧。

以下是这一集的文字记录。为了篇幅和清晰度,采访经过了编辑。

Craig Bettenhausen: 欢迎来到C&EN揭秘。我是Craig Bettenhausen。C&EN揭秘是我们在Stereo Chemistry上尝试的新东西。在每一集中,我们将深入了解化学与工程新闻最近的封面故事。C&EN精明的化学记者将分享他们报道中的惊人时刻,他们最大的收获,以及在剪辑室地板上留下的东西。在这一集中,我们将深入研究去年9月的一个封面故事,关于百亿亿次计算及其对化学的意义。我和Ariana Remmel在一起,他写了那篇文章。嗨,Ari!

Ariana Remmel: 嘿,Craig。感谢大家邀请我做客播客。

Craig: 我们将在这一集的节目说明中链接到那篇文章,或者你可以在9月5日的C&EN印刷版上找到它。那是2022年9月5日。如果你还没看过,一定要去看看。但是我认为一个好的开始,Ari,是让你解释一下什么是百亿亿次计算。这是一个大而可怕的词,在我读到这篇文章之前,我对它也很陌生。

Ariana: 所以,我在C&EN的职责是确保我们的听众了解物理化学,计算化学,天体化学的最新发展。百亿亿次计算机,是新一代的超级计算机,实际上很适合我已经写过的故事。

所以,化学家们使用超级计算机的时间和超级计算机出现的时间一样长。这些系统能够进行大量的计算,它们的计算能力是以每秒浮点运算次数为单位来衡量的,浮点运算基本上是一种奇特的计算算法,可以处理,比如科学记数法,小数点可以移动的数字。所以,一台标准的笔记本电脑每秒可以进行数十亿次计算,这就是为什么我们的笔记本电脑可以处理所有这些标签。这么多标签。这也是为什么它们可以帮助渲染非常可爱,清晰的显示,图像,并帮助我们可视化分子。

但如果我们真的试图在计算机上研究和模拟一个复杂的分子系统,你需要更多、更多的计算能力。所以,在化学家的超级计算机领域中,传统的计算机已经能够进行数万亿次的计算,呃,可以实现数万亿次的浮点运算,也就是每秒浮点运算。

Craig: 这是一个伟大的名字。

Ariana: 这绝对是一个有趣的词。现在,在美国,最强大的超级计算机实际上是在千万亿次浮点运算的范围内,它每秒可以进行超过一千万亿次的计算。以Summit为例,它是橡树岭国家实验室一台每秒千万亿次浮点运算的计算机,这台计算机每秒可以进行200千万亿次浮点运算。这是一个惊人的能力,在某种程度上,这台超级计算机被用来执行很多计算,这些计算进入了现在标志性的SARS-CoV-2病毒包膜模型,我想,我敢打赌,我们的观众在这一点上已经在互联网和各种新闻出版物上看到了。

所以,所有这些都是为了建立一个事实,那就是百亿亿次计算机,在美国,第一台新的百亿亿次计算机现在被称为「Frontier」,也在田纳西州东部的橡树岭国家实验室,这台计算机将比「Summit」强4到5倍。这是因为它可以做到,它已经打破了每秒百亿次浮点运算的障碍,它每秒可以进行一百亿亿次的计算。这是10^18,绝对是惊人的。

Craig: 这个问题可能是在棒球内部(在美国俚语中,「棒球内部」一词指的是只有专家、内部人士和爱好者才感兴趣或欣赏的系统的细节和详细的内部运作。),但这些是一些疯狂的话,我只是有点…你花了多长时间来理解这些千万亿次和百亿亿次浮点运算和这个…(笑声)

Ariana: 是啊,不,这很公平。

我想说的是,让我在这个故事中彻夜不眠的很多事情都是为了核实事实,以确保我在所有这些数字中都有正确的零数量。现在,我认为很多这些术语,对于大多数化学家来说,在我们的日常计算中可能没有那么重要。

然而,了解硬件及其功能背后的惊人创新水平对化学家来说非常重要,你知道,当我们开始应用这种新型仪器,百亿亿次超级计算机,深入研究化学系统的复杂性时,化学科学将打开什么样的大门,这些复杂性是我们无法获得的,或者是在我们之前的早期模型中无法看到的。

Craig: 是的。我们来讨论一下这个问题,因为你提到了蛋白质和脂质以及COVID-19颗粒之类的东西。

你可以想象,你需要很多的计算能力来模拟蛋白质的弯曲,扭曲和挤压,但是在化学世界里,除了蛋白质和脂质人群,还有谁需要这样的东西呢?

Ariana: 是的,所以,当你试图了解化学系统中的物质,化合物是如何运动的时候,你知道,这些分子动力学模型,部分用于模拟SARS-CoV-2病毒粒子,这些将是非常重要的。

Craig: 听起来你说的其中一件事是除了能够模拟更复杂的系统之外,它还能让我们模拟系统我们可能已经在一个模型上了,但是要模拟一个更长的事件。

Ariana: 是的。这个更长的时间框架让很多科学家非常非常兴奋,特别是在生化领域,因为如果我们真的想要能够创建生物系统的受控计算模型来真正提出问题,你知道,在我们的实验设计中发生了什么,实验结果在做计算研究时仍然非常重要,因为你有一个基准,对吗?你需要知道你正在研究的东西是真实的。如果不是,你可以做一些改进。但在现实生活中,在生命系统中,这些反应发生在更长的时间尺度上,这是由于有限的计算能力而无法实现的。

Craig: 所以除了化学家,还有谁在这台机器上竞争时间呢?这是真的,我们没有独家访问权。

Ariana: 不,我们绝对不需要。我之前提到的Frontier是第一个在美国首次亮相的百亿亿次计算机,也是三个预计将真正投入使用的计算机中的第一个,在2023年的某个日历年向公众开放。另外两个系统,伊利诺伊州阿贡国家实验室的Aurora和加州劳伦斯利弗莫尔国家实验室的El Capitan,这两个系统也将很快上线。你会注意到这三个实验室都是能源部的国家实验室。有了这种计算能力,人们对寻找更节能的催化剂非常感兴趣,当然是在化学领域,但也能够研究湍流,研究宇宙膨胀,这些物理和能源系统中的其他大问题也需要同样多的计算能力。

所以,我知道有很多宇宙学领域的人非常兴奋地使用这些百亿亿次计算机来尝试看看我们是否可以创建宇宙起源的模型并尝试真正深入到宇宙如何膨胀的一些基本细节。

Craig: 你去过那里,你去过这个设施。在这个超凡脱俗的地方是什么感觉?

Ariana: 所以我从阿肯色州的小石城开车到田纳西州的橡树岭,就在诺克斯维尔往北一点,在这个州的东部边缘。这是美丽的山地景观,有郁郁葱葱的绿树。严格来说,它不是阿巴拉契亚山脉的一部分,但它离大烟山国家公园不远。

所以这里的风景非常美。为了真正到达橡树岭,就像你必须…首先,你必须通过安全检查才能通过大门。所以,我去了,给了他们我的身份证。但我的建议是继续走下去,当你到达那里的时候你就知道了,你知道,在这种多山的山谷里绝对是美丽的。但是橡树岭,真正的校园,真的很漂亮,它看起来很像一个标准的研究型校园。但是我采访过的其中一个消息来源,布朗森·梅塞尔,他是橡树岭领导计算设施的科学主任,他说,是的,如果你看看这些建筑,很多都是在20世纪40年代建造的,当实验室最初建立的时候。但是计算设施看起来像是,蒸汽朋克式的改造,因为所有这些,就像,你知道,他们对它做了一些管道和改造,以确保他们能容纳所有这些计算机,为它们供电,存储它们,这实际上有点疯狂。

走进去有一个很酷的观景台,人们可以往下看,就像玻璃窗,你可以往下看这个白色的大房间,在你的正前方,是Frontier的第一个柜子。上面写着"Frontier"两个大字。这样你就知道你在看什么了。工程师们在这些柜子里进进出出,或者在这些柜子周围移动。一共有74个,每个都重约8000磅,部分原因是里面的组件数量太多了,而且,你知道,因为它每分钟要泵送6000加仑的冷却水。所以它们非常非常重。他们要做的一件事就是,加固地板以确保地板能够承载所有的计算能力。

当我7月份去参观这个设施时,工程师和设施管理人员仍在努力「摆脱节点」,对,他们需要能够……我的意思是,想想这个事实真的真的很有趣,就像,这台机器里有这么多部件,可能会出问题,对吧?所以他们必须确保每一个组件都能正常工作。

但真正让我吃惊的是,你知道,当部件失效时,它们往往在机器寿命的开始阶段就失效了。

这就是为什么他们需要确保他们在一开始就做了很多工作来检查所有不同的硬件位。当我在那里的时候,有一个工程师坐在一个小板凳上,拿着一把螺丝刀,把这些创新的部件重新拉出来,把它们拿出来,再放回去。他还带了一小瓶异丙醇来帮助清理。这有点令人惊讶,对吧,回忆起来,就像,就像,在一个房间里,建造和设计这台机器的人之间有着清晰的联系,就像,从中产生的不可思议的科学。

我想我和橡树岭的人谈论的其中一点是一开始我很纠结,好吧,我该把Frontier叫做机器还是乐器?当然,按照计算机就是机器的标准,它绝对是一台机器,但我交谈过的大多数研究人员都对这些超级计算机的用户将如何使用它们感兴趣,对吧?所以从这个角度来看,把它看作是科学家的一个工具而不是一个能够自我产生科学突破的东西。你知道,真的是人们将这个超级计算的新时代带入现实。

Craig: 是的。这个摇出的节点让我想起,当我参观哈佛的科学史博物馆时,他们有一个早期的,我的意思是,这是一个超级计算机。它没有现在的袖珍计算器那么强大,但它描述了,你知道,捕捉虫子,在那个时候,虫子真的会被放进机器里,真的会被困在里面。

Ariana: 是啊,太疯狂了。我不认为【Frontier】有任何漏洞。我的意思是,这是一个非常干净的空间,你知道,有点像科幻级别的白色房间,这台电脑的黑色巨石只有微弱的嗡嗡声。里面其实很安静,我觉得这很了不起。我不知道有什么漏洞。我确实试着算出有多少个螺丝,但是没人,我,我没能得到一个好的答案。你知道,这个边境和其他DOE exascale计算机计划投产都称为exascale计算机项目的一部分,成立于几乎超过5年前,对,所以这一事实FrontierCOVID期间能够得到安装,它是保存在时间表,这真的超出预期在很多不同的方面,考虑到短时间内从提案到实际执行,也很了不起。

Craig: 那么,在这些大型计算机领域,你下一步的目标是什么?

Ariana: 是的。我的意思是,我认为有很多非常有趣的问题,我期待着去了解。我们如何使用人工智能和机器学习来简化化学家感兴趣的一些计算任务的一些基础知识。我知道这里有很多术语,但是为了教会计算机哪怕是化学直觉的基础知识这些都是我们在化学课上学到的所有基础化学课程加上我们在实验室的时间,为了让计算机学会这些,它们需要大量的数据集才能开始建立联系,这就是机器学习的工作方式,对吧?如果你想想像戴尔- e2这样的系统,甚至是克雷恩,这些在社交媒体上走红的人工智能图像生成工具,就像,这些技术通常是用数百万张带标签的图像开发的,对吧?所有这些不同的参数。我们现在还没有达到,第一,我们甚至有化学系统的数据集有足够的参数,但我们也没有能力处理所有的数据,以一种机器学习算法可以真正尝试开始建立联系的方式,这样它就可以在一个从未见过的系统上「自己思考」。因此,拥有的能力来训练这些算法可以来自experimentation-which的更大的数据集,你知道,exascale计算机将把需要,但是也能够训练他们的exascale计算机,因为他们可以让机器学习所有不同的节点,它需要建立这些联系是要给我们访问算法,将很可能在其他领域的实用化学,对吧?因此,我认为,这是一个让我兴奋的地方,看到百亿亿次计算的突破如何对化学家产生直接影响,他们可能永远不会在前线或任何其他能源部的超级计算机上进行实验。

Craig: Ari,非常感谢你花时间告诉我们这一切。

Ariana: 是的,非常感谢你和我谈论这个故事。这非常令人兴奋。请在线查看完整版本,如果想了解更多更新,你可以在Twitter上关注我:@science_ari。

Craig: 同样,你可以在C&EN的网站或2022年9月5日的C&EN印刷版上找到Ari关于百亿亿次计算的封面故事。我们在节目单上加上了链接,并附上了剧名。你可以在社交媒体上找到我@CraigOfWaffles。

这就是C&EN揭秘,C&ENStereo Chemistry的新系列。Stereo Chemistry是化学与工程新闻的官方播客。C&EN是由美国化学会出版的独立新闻媒体。

谢谢你的聆听。

更正:该记录已于2023年2月2日更新,以准确反映集录音中描述的单位百亿亿次浮点运算的度量。每秒的百亿亿次计算是10^18,不是1018。

原文链接:

https://cen.acs.org/physical-chemistry/computational-chemistry/Podc ast-chemists-excited-exascale-computing / 101 / web / 2023/01