當地時間10月9日,瑞典皇家科學院宣布,將2024年諾貝爾化學獎授予大衛·貝克,以表彰其在計算蛋白質設計方面的貢獻,另一半則共同授予德米斯·哈薩比斯和約翰·江珀,以表彰其在蛋白質結構預測方面的貢獻。他們分別設計出人工智慧軟體RoseTTAFold和AlphaFold,都成為引領該領域研究的重要工具。
精美的折紙作品在被巧手折疊前,只不過是一片扁扁的木漿制品;蛋白質也一樣,功能要在折疊後才能實作。如何從胺基酸序列預測蛋白質的三維結構,一直是分子生物學中的關鍵挑戰。
在廣東,深圳灣實驗室系統與物理生物學研究所副所長周耀旗的課題組曾為AlphaFold 2的底層技術框架添磚加瓦。該課題組率先預測蛋白質二面角,發展無片段結構預測方法,成為AlphaFold 2成功實作高精度蛋白質結構預測的重要一環。目前,該課題組專註於解決AlphaFold2的預測精確度嚴重依賴天然同源序列的這個挑戰性問題。
設計出不存在於自然界中的蛋白質
在諾貝爾獎官網的圖片上,大衛·貝克頂著一頭標誌性的蓬松亂發,笑容可掬。
進入生物領域前,他的專業是哲學。大學期間,大衛·貝克對生物學表現出興趣,很快成為華盛頓大學生物化學系助理教授,他和學生共同開發了一款名為Rosetta的程式,如果已知一條胺基酸序列,程式就能算出其最後折疊而成的蛋白質的三維結構。
在計算結構之余,大衛·貝克產生了一個想法:如果反過來,已知蛋白質的最終結構,能否用程式倒推出它的胺基酸序列?
沿著這個思路,2003年,大衛·貝克團隊設計出了第一個原本並不存在於自然界中的蛋白質——Top7。這個成果有力地支撐他獲得諾獎。
不過,Top7只完成了上述從蛋白質結構到胺基酸序列的倒推,卻沒有實際功能,就像一個可遠觀但不可上手把玩的折紙娃娃。
蛋白質設計遠比蛋白質預測更難,一種蛋白質結構所對應的胺基酸序列可能有成百上千億種可能。這也可能是大衛·貝克獨得「半個」諾獎,而其他兩位科學家要分享另外「半個」的原因。
讓人工智慧更準確地預測蛋白質
今年5月,人工智慧工具AlphaFold 3問世,在試圖解決蛋白質折疊問題、預測生物分子結構方面再次升級,很多學者認為這是具有裏程碑意義的進展。
AlphaFold 3背後的兩位主創正是德米斯·哈薩比斯和約翰·江珀。他們是谷歌DeepMind團隊的核心成員,此前已獲得2023年生命科學突破獎。
如上文所說,更深入地了解蛋白質折疊問題,對人類了解疾病、研發新藥和理解生命體的運作方式都有意義。
自1994年起,和大衛·貝克一樣想要解開蛋白折疊之謎的生物學家們會定期聚在一起「比賽」,他們會拿到一個蛋白質的序列,然後用最新的蛋白質折疊工具預測出它的結構,並與透過實驗方法得到的「正確答案」進行比對。
但預測蛋白質結構很不容易,20多年來大家的成績進展不大,直到2020年末AlphaFold2的出現。
AlphaFold2的三維蛋白質結構預測模型準確率超過90%,比最接近的競爭對手高出5倍。透過深度學習,人工智慧近乎輕松地破解了「人力不可為」的難題,震撼了生物學界。
近幾年,AlphaFold2改變了生物學家研究蛋白質的方式,被證明是一個強大的預測工具。但同時,它也沒有取代生物實驗,而更像一個縮小目標範圍的手段。
據【世界科學】雜誌訊息,周耀旗曾談到下一步蛋白結構預測系統將如何發展。他認為,最終的蛋白質結構預測系統應該是一個物理原則感知的模型,這樣可以在抗體設計、藥物開發時提高功能預測的準確度。「AlphaFold3在預測抗體結構的時候,就引進了物理因素來對預測的抗體結構進行排序。」但他同時也表示,現階段AlphaFold的結構預測是否已經能發現全新藥物分子,還存在爭議。
這是一個方興未艾的研究領域。被AlphaFold超越後,大衛·貝克的團隊很快完成了追趕,在【科學】雜誌上介紹了其開發的RoseTTAFold演算法,同樣能預測和解析蛋白質三維結構。
此番分享諾獎並不是終點,3位諾獎科學家在這條賽道上的切磋比拼顯然還會持續下去。
南方+記者 鐘哲
【作者】 鐘哲
廣東科技頭條