AI的翅膀開始嫁接到各行各業,其中就包括醫療行業。最近,眾多科技巨頭如微軟、輝達和谷歌等,都加大了「AI+醫療」的布局。比起傳統研發行程,AI能夠在較短時間內處理大量復雜數據,AI可以提高藥物研發效率,加速藥物篩選。不過,透過AI大模型完全模擬對算力的要求極高,足量的訓練數據仍然是一大瓶頸。
多家公司入局
當地時間5月8日,谷歌DeepMind及姊妹公司Isomorphic Labs旗下的AI藥物研發模型AlphaFold官宣重磅升級,稱最新版本AlphaFold 3可以預測蛋白質、DNA、RNA等生物分子的結構以及它們如何相互作用。
Alphabet兼谷歌CEO Sundar Pichai表示,目前,已有180多萬名研究人員在疫苗開發、癌癥治療等研究工作中使用AlphaFold進行蛋白質預測。在接受采訪時,Isomorphic Labs的CEO Demis Hassabis表示,人工智能系統有可能徹底改變醫學,並創造「巨大的商業價值」。
盯上這條賽道的不止谷歌一個。美國的眾多科技巨頭已經感觸到「AI+醫療」的市場機會,紛紛加大布局。輝達創始人兼CEO黃仁勛曾多次強調,數碼生物學將是「下一場驚人的顛覆性技術」。誠如他所說,今年3月輝達舉辦的2024GTC大會上,醫療健康仍是「重頭戲」之一,與生命科學相關的會議活動排在所有行業之首。
過去兩年間,輝達旗下AI藥物研發平台BioNeMo的風投部門Nventures把大部份錢都投給了藥物研發專案。數據顯示,Nventures的19筆投資交易中有7筆是投向AI藥物研發初創公司。
最近,公司還投資了一家機器學習藥物研發初創公司Relation Therapeutics。整個2023年,輝達投資了9家專註於藥物研發領域的科技初創公司。輝達醫療健康副總裁Kimberly Powell直接表示:「醫療健康將成為輝達下一個數十億美元級業務。」
其他幾家科技巨頭也發力藥物研發領域。僅在去年一年中,Salesforce推出了蛋白質生成AI大模型ProGen,微軟釋出了一個類似的開源模型EvoDiff,亞馬遜還為其AWS機器學習平台SageMaker釋出了蛋白質折疊工具,據報道,甚至連字節跳動也在招聘科學和藥物設計團隊。
投資熱情
「AI+醫療」如今已經成為一片熱土,吸引各方關註。IDC一項研究顯示,79%的醫療保健組織正在使用AI技術。在媒體采訪中,谷歌DeepMind、輝達的高管都表示,可用的大量訓練數據、計算資源的爆炸和AI演算法的進步,這三大因素共同激發了AI在藥物研發上的潛力。這同樣激發了投資熱情。
根據Pitchbook的數據,自2021年以來,全球AI藥物研發初創公司的風投交易已有281筆,投資額達到77億美元。另據Global Market Insights報告,預計「AI+醫療」市場的年均復合增速將超過29%,2032年將達到700億美元。藥物研發和醫學影像成為AI套用最重要的兩個領域,市場份額占比合計超過50%。
比起傳統研發,AI制藥以醫藥大數據為基礎,將人工智能技術套用到制藥各環節,提高新藥研發效率及質素,降低研發成本。中商產業研究院研報分析指出,AI技術如今主要用於藥物研發階段,隨著技術的不斷突破和發展,AI技術參與制藥的環節將增多,新藥研發效率也將提升。
「2010年到2021年,全球由AI參與的藥物研發專案從最初的6個增長到158個。最近的一項調查研究顯示,由AI參與的藥物研發管線,無論是新靶點、新機制的First-in- class(首創新藥)藥物研發,已知靶點的Best-in- class(同類最佳)藥物研發,還是Drug Repurposing(老藥新用)的研發,AI均可以很大程度地加速藥物研發流程,降低藥物研發整體成本。」全球健康藥物研發中心數據科學部負責人郭晉疆表示,AI可以參與藥物研發的每一個環節,包括疾病關鍵靶蛋白的確立和驗證,小分子/疫苗/抗體的設計與最佳化、中後期的毒性和安全性評估等各個環節,AI都可以賦能和協助加速藥物研發行程。
美國依然是「AI+醫療」最為火熱的區域。據統計,目前全球AI藥物研發企業約343家,其中超過50%集中在美國,英國和歐盟分別占據12.5%和13.4%,亞洲大約為12.8%。
麥肯錫全球研究所(MGI)估計,生成式AI每年可為制藥和醫療行業帶來600億至1100億美元的經濟價值。輝達方面透露,使用AI技術可使藥物早期發現所需時間縮短至1/3,成本節省至1/200。
此外,跨國藥企積極擁抱AI技術帶來的變革。目前全球排名前20的藥企,如輝瑞、強生等巨頭都已經布局AI+新藥研發。2023—2024年2月,有公開金額的跨國藥企與AI藥物研發企業合作專案,潛在總額超過120億美元,平均值為8.4億美元。
還未落地
雖然將AI套用於藥物研發的潛力十足,但距離真正進入醫藥市場仍有很長的路要走。業內分析表示,透過AI大模型完全模擬藥物研發的這一過程對算力的要求極高,足量的訓練數據仍然是一大瓶頸。合成生物學公司Ginkgo Bioworks的AI負責人Anna Marie Wagner表示,像GPT這樣的新型基礎模型依賴於強化學習,是一種模仿人類為實作目標而反復訓練的學習過程,更依賴於高質素的海量數據。
到目前為止,尚未有AI輔助研發的新藥上市。有數據顯示,全球有超80款AI藥物進入臨床試驗階段,大多數處於臨床早期階段,僅有少數進入Ⅱ期臨床試驗,還有部份AI輔助研發的藥物因臨床表現不佳而終止。
今年4月,英國AI藥物研發公司BenevolentAl宣布,用於治療特應性皮炎的局部泛Trk抑制劑BEN-2293的Ⅱa期臨床試驗沒有達到次要療效終點,該藥曾被認為具備潛在同類最佳潛力。
郭晉疆指出,生命科學領域的數據呈現出多模態、多尺度、異質化的特征,既有來自於基因測序的數據、蛋白質或化學化合物結構化的數據,也有來自於生物活性的特定數據等,數據量初步估算為百億級。而AI缺乏對生物體系機制的認知,對不同尺度、不同層級的生物學數據缺乏系統性理解,如蛋白構象變化、分子以及藥代動力學過程等時間、空間尺度資訊。
「從合作模式而言,如何構建一個有效的閉環很重要。AI演算法和實驗之間的閉環,不僅僅存在技術上的難度,還有互信的難度。」微軟研究院科學智能中心首席研究員夏應策認為,應建立有效的機制,讓AI的專家願意為實際問題針對性地設計演算法,實驗組的化學專家們也願意為AI設計出來的分子進行評估和測試。
DeepMind的科學副總裁Pushmeet Kohli更是直觀地形容數據量的痛點:「垃圾進,垃圾出。」據報道,美國食品藥品管理局(FDA)迄今為止已經批準了100多種使用AI或機器學習進行開發的藥物候選物的臨床試驗,但可能需要數年時間才能上市。
北京商報記者 趙天舒