當前位置: 華文世界 > 科技

AI憑啥又得獎?就憑它半小時幹完了幾年的活

2024-10-10科技

今年的諾貝爾化學獎頒給了兩組研究者, 他們制造的分析工具極大地提升了蛋白質研究的效率 ,為生物科學研究和套用帶來了不可估量的巨大影響。

2024年諾貝爾化學獎的主題是蛋白質。化學獎得主大衛·貝克構建出全新的蛋白質,成功完成了幾乎不可能的壯舉。戴密斯·哈薩比斯與約翰·朱默帕開發了一種人工智慧模型,解決了一個 50 年前的問題:預測蛋白質的復雜結構。

AlphaFold:

又快又準的蛋白質結構預測

一組獲獎者是 戴密斯·哈薩比斯(Demis Hassabis)與約翰·朱默帕(John M. Jumper) 他們參與創造了AI蛋白質結構分析工具AlphaFold

蛋白質的功能是由分子的三維空間結構決定的,因此,想要真正地理解蛋白質如何發揮作用,科學家們就必須準確地掌握 蛋白質的空間結構

蛋白質通常由20種胺基酸組成,但它們可以組合成無數種方式。胺基酸鏈會扭曲和折疊成一個獨特的(有時是獨一無二的)三維結構,正是這種結構賦予了蛋白質功能。

了解組成蛋白質的胺基酸序列是容易的,但確定它具體的空間結構卻相當困難。在過去,確定蛋白質結構依賴X射線繞射、冷凍電鏡等實驗方法。這些方法相當耗時:在晶體時代,弄清一個晶體結構往往就會消耗一個博士生的整個求學生涯。雖然也有早期的分析軟體可用,但它們往往 不夠準確,參考價值有限

AlphaFold的過人之處就在於它不僅非常快,而且相當準確,因此大大提高了蛋白質研究的效率

蛋白質結構預測的裏程碑式事件是在2020年的 CASP14 上, AlphaFold2預測蛋白質的分辨率達到了近原子級別 。更重要的是,這些結構在細節上是「對」的——也就是說, 在藥物篩選等研究場合,AI的預測結果變得很有用

在速度上,AlphaFold2也遠遠甩開了實驗手段: 消耗一個博士生幾個月甚至幾年的時間才能得到的結構 ,一張GPU花半個小時就可以得到一個近似的,這在之前是無法想象的。正是依靠這樣的效率,AlphaFold在很短的時間內就預測了六七億個蛋白質結構。

從2018年的1代到2024年的3代,AlphaFold經歷了巨大的升級改進。從采用經典摺積神經網路架構的初始模型,到引入能力更強的Transformer架構、預測準確率史無前例的2代模型,再到 能夠預測「幾乎所有分子類別型」的蛋白質復合物結構的3代模型 ,能力不斷飛躍。

戴密斯·哈薩比斯與約翰·朱默帕使用他們AI模型AlphaFold2,計算了所有人類蛋白質的結構,並預測了目前已知的地球生物共2億種蛋白質的結構。Google DeepMind公開了AlphaFold2 的程式碼,到2024年10月,190個國家的200多萬人使用了 AlphaFold2。圖片中為AlphaFold2幫助研究人員的例子。

大約半個世紀以前,有位名叫克里斯汀·安芬森的科學家,他在研究RNA酶的時候發現:對一些蛋白質來說,只要環境不變,它的天然結構便只由胺基酸序列決定。換句話說, 給定一個胺基酸序列,理論上就可以預測出蛋白質的三維結構

後來的幾十年間,科學家們在預測蛋白結構的路上艱難地前行,希望有朝一日能把「理論上」這幾個字去掉。

而現在, Alphafold的出現已經讓這個夢想基本成真

Rosetta:制造全新的蛋白質

與兩位人工智慧研究者分享諾獎的是 生物化學家大衛·貝克(David Baker) ,他的研究成果是 利用電腦軟體從頭開始設計全新的蛋白質

這正是 蛋白質結構預測的反向操作 :這一次, 人們輸入的是蛋白質空間結構的「設計圖紙」,電腦會根據圖紙反推出對應的胺基酸序列 。只要按照這個胺基酸序列進行合成,就可以得到人們想要的、具有特定功能的新蛋白質。

在過去,科學家沒有辦法完全憑空設計一種新蛋白質,他們只能依靠自然界已經存在的蛋白質,然後對它們的結構加以改造。就像是透過改裝鳥來設計飛機一樣,這種改造的方法有很大的局限性而且效率低下。

而貝克和他開發的蛋白質分析軟體Rosetta徹底改變了這種局面,讓 從頭開始輕松設計蛋白質變成可能 。2003年時,他首次利用軟體成功創造出了一個與天然蛋白質截然不同的新蛋白質:Top7。

大衛·貝克首次創造出了與已知的所有蛋白質完全不同的蛋白質Top7。過去,從事蛋白質設計的研究人員只能模仿現有結構來創造新蛋白質,但Top7的獨特結構在自然界中並不存在。此外,它含有93個胺基酸,比以前使用「從頭設計」生產的任何蛋白質都要大。

在此之後, Rosetta軟體不斷升級,如今它也與人工智慧模型結合了起來

這些研究如何影響我們?

分析蛋白質結構和設計全新的蛋白質在很多領域都有著重要的套用價值,從這些研究工具中產生的新成果可能也會改變我們的生活。

比如說,這些分析軟體在醫藥領域就有很多套用。很多藥物的作用靶點都是人體內的蛋白質,分析了這些蛋白質的空間結構,就 可以高效地篩選能與它結合的分子,進而從中找出具有潛力的新藥 。而了解了空間結構特征,也可以設計出相應的新型蛋白質,讓它們成為新的 藥物、疫苗或是載體

貝克實驗室使用電腦軟體Rosetta創造了許多蛋白質,圖片展示了其中幾個例子。大衛·貝克公開了Rosetta的程式碼,所有研究者都可以使用該軟體,尋找新的套用領域。

除此之外,也可以 把新蛋白質開發成工業催化劑、新型傳感器或是新材料,讓它們在不同領域發揮作用。

有了本屆諾獎得主貢獻的研究工具,這些研發工作都可以以前所未有的速度進行。

參考文獻

[1]https://www.nobelprize.org/prizes/chemistry/2024/popular-information/

[2]https://mp.weixin.qq.com/s/kpsvK65TTIkijtE0eXWrcQ

[3]https://mp.weixin.qq.com/s/KHQz9oV0Sy2XNqPbHFuw3A

作者:腺嘌呤核苷三磷酸,栗子,窗敲雨

編輯:窗敲雨,odette

快來關註,不要錯過!

本文來自果殼,未經授權不得轉載.

如有需要請聯系[email protected]