當前位置: 華文世界 > 科技

生成式AI進軍基因編輯領域 有望帶來個人化治病方案

2024-05-05科技
科技日報記者 張佳欣
制圖、寫歌、作詩、編程、生成影片……生成式人工智能(AI)技術與各行業的結合不斷為人們帶來驚喜,在各領域掀起革新浪潮。
現在,AI的套用場景再次拓展:美國AI蛋白質設計公司Profluent宣布,一款完全由AI設計的基因編輯器,已成功編輯了人類細胞中的DNA。這預示著未來科學家能更精確、更快速地對抗疾病。
OpenCRISPR-1的物理結構,這是一種由Profluent的AI技術建立的基因編輯器。圖片來源:singularityhub.com
首款AI設計的基因編輯器
4月22日,初創公司Profluent宣布推出OpenCRISPRTM計劃,並聲稱其成功使用AI生成的基因編輯器(稱為OpenCRISPR-1)來編輯人類DNA。該公司表示,這是「世界上第一個開源的、AI生成的基因編輯器」,並且是「用AI從頭開始設計的」。
這家公司將大量生物數據輸入一個大型語言模型(LLM),在基因編輯技術CRISPR基礎上提出了新的編輯方法。其目標是構建比現有生物機制更有效、更有能力的基因編輯器,使生物體能夠抵禦疾病和其他病原體。Profluent團隊相信,在其他領域遊刃有余的AI,同樣可以在基因編輯領域如魚得水。
「嘗試用AI設計的生物系統來編輯人類DNA是一次科學上的挑戰。」Profluent聯合創始人兼行政總裁阿裏·馬達尼說,「我們的成功預示著未來AI將精確設計出一系列客製的疾病治療方案。為了促進基因編輯領域創新,推動這一未來趨勢,我們正在開源OpenCRISPRTM計劃的產品。」這意味著OpenCRISPR-1編輯器是開放的,允許個人、學術實驗室和公司免費試驗該技術。
CRISPR和AI的「天作之合」
CRISPR這一基因編輯工具的靈感,來自細菌和古菌等原核生物的適應力免疫機制。在自然界,細菌和古菌透過CRISPR-Cas系統來對抗病毒入侵。該系統透過記錄並剪下病毒基因組來保護細菌免受病毒感染。科學家們透過對CRISPR-Cas系統的研究,成功開發出了一系列強大的基因編輯工具,例如CRISPR-Cas9。
可以說,CRISPR是大自然擲了數十億次骰子後(自然選擇)產生的強大工具之一。不過,棘手的是,大多數Cas9蛋白長度超過1000個胺基酸,總體設計空間包含20的1000次方個可能序列,這比可觀測宇宙中的原子數量還要多幾個數量級。
只有當這些蛋白質以正確順序排列並相互作用,才能實作精準切割。因此,即使是單個錯誤突變,也可能讓蛋白質完全喪失功能。透過實驗探索所有可能的序列變異,需要幾代科學家的努力。但現在,透過AI系統,在幾個小時內就可以輕松發現功能性基因編輯器。
Profluent公司采用了一種新穎方式來使用AI:他們沒有增強現有系統,而是使用大型語言模型從頭開始設計CRISPR元件。該模型也是聊天機器人ChatGPT和影像生成系統DALL-E的基礎。
現在,人類的DNA,也能由AI重新覆寫了。
語言模型生成多種CRISPR-Cas蛋白
生成蛋白質語言模型需要大量數據進行預訓練,而這需要涵蓋廣泛功能的大型、多樣化的天然蛋白質序列數據集。為此,Profluent建立了迄今為止最廣泛的CRISPR系統數據集,包含510萬個CRISPR-Cas蛋白質數據。研究人員利用該數據集訓練AI大型語言模型,並要求AI建立可在CRISPR系統中代替Cas9的潛在蛋白質。
結果顯示,系統從400萬個序列中進行篩選,最終確定了包括OpenCRISPR-1在內的新蛋白質。這種新設計蛋白質在測試中的表現與Cas9不相上下,但有一點明顯突出:它對脫靶位點的影響降低了95%。這意味著它更加精確,幾乎只在需要的地方起作用,而不會對DNA鏈造成任何多余損傷。
總體而言,這些結果將潛在Cas蛋白的範圍擴大了近5倍。這些AI生成的蛋白質表現出更廣泛的功能。它們在不同條件下保持高活性,能輕松適應不同的溫度和分子環境。
Profluent尚未將這些合成基因編輯器進行臨床試驗,因此尚不清楚它們能否趕上或超過CRISPR的效能。但概念論證表明,AI模型能夠編輯人類基因組。
此外,Profluent的平台能隨意生成更多的基因編輯系統,而OpenCRISPR-1只是「冰山一角」。
發表在預印本伺服器bioRxiv上的論文尚未經過專家同行評審。預計下個月,該公司將在美國基因和細胞治療學會年會上送出這篇論文。與此同時,OpenCRISPR-1或其變體在多種生物體(包括植物、小鼠和人類)中是否都能發揮作用還有待證明。此外,技術的倫理和安全問題也需要考慮。但令人興奮的是,這些突破性成果為生成式AI開辟了一條新途徑,將對醫學和健康領域產生廣泛影響,有望從根本上改變人們的基因藍圖。