黃仁勛看好的下一個萬億美元AI賽道是什麽？

2024-05-09科技

如果要問AI的下一個黃金賽道是什麽？黃仁勛的答案是生命科學。

他在很多場合明確表達了這個觀點，比如在一場「世界政府峰會」的會議中，他說：「每個人都要學習電腦的時代已經結束了，未來的世界應該是生物學。」

在另一場會議的問答環節中，他說如果有重來一次的機會，他會首先考慮生物學，特別是和人類相關的生物學。

不僅僅是黃仁勛這麽說，輝達對外投資也證明了這一點。近兩年，輝達近乎瘋狂地在醫療和藥物發現領域投資，已投資了超過十幾家初創公司。

據WSJ報道，Moon Surgical是一家利用AI改進腹腔鏡手術的法國創業公司，其行政總裁Anne Osdoit說，她的公司大約在三年前就開始與輝達合作，當時該公司正在為生命科學領域開發芯片。她說，這種合作關系最終促成了投資，輝達還幫助公司解決了有關手術機器人的技術監管擔憂。「輝達非常務實，直接說‘嘿，告訴我們你需要什麽’。」

輝達醫療保健副總裁Kimberly Powell甚至直言：「既然電腦輔助設計行業捧出了第一家2萬億美元市值的芯片公司，電腦輔助藥物發現行業，為什麽不能打造下一個價值萬億美元的藥物公司呢？」

在今年輝達GTC大會上，與醫療保健/生命科學相關的活動將達90 場，也突顯了輝達對生命科學領域的重視。「我們是相當內行的投資者。」今年1月，黃仁勛在一場摩根大通醫療健康會議上說，「如果你在計算或AI方面有困難，請給我們發郵件，我們隨時為你服務。」

輝達的對外投資中，醫療保健和生物技術類非常多

創新藥研發一直都費時費力，業界有一個著名的「雙十定律」，即研發一款新藥需要10年時間、10億美元，並且成功率也只有10%。所以哪怕是微小的改進，也將價值連城。

科學家們一直在努力用傳統的統計工具，來嘗試改進效率，機器學習使篩選成堆的資訊成為可能。比如谷歌DeepMind曾利用其AlphaFold系統，來預測蛋白質結構。這項技術的最新進展出現在5月8日的【自然】雜誌，新推出的AlphaFold 3不僅能夠模擬蛋白質與其他分子的相互作用，還能準確預測包括DNA、RNA、配體等生物分子結構以及它們如何相互作用，這項技術能改變我們對生物世界和藥物發現的理解。

下面我們來看看 AlphaFold 3 令人興奮的一些預測結果:

7PNM - 一種普通感冒病毒的突起蛋白（冠狀病毒OC43）：隨著病毒蛋白（藍色部份）與抗體（綠色）和單糖（黃色）相互作用，AlphaFold 3對7PNM的預測結果與真實結構（灰色）完全吻合。這能夠增進我們對這種免疫系統過程的了解，有助於更好地理解冠狀病毒，包括COVID-19，從而提高改進治療的可能性。

8AW3 - RNA修飾蛋白：AlphaFold 3 預測的由蛋白質（藍色）、一條 RNA 鏈（紫色）和兩個離子（黃色）組成的分子復合物與真實結構（灰色）非常吻合。這個復合體參與了其他蛋白質的生成，這是一個對生命和健康至關重要的細胞過程。

7R6R - DNA結合蛋白：AlphaFold 3 預測的蛋白質（藍色）與 DNA 雙螺旋（粉色）結合的分子復合物，其預測結果與透過復雜實驗得到的真實分子結構（灰色）幾乎完全吻合

圖片來源：Google DeepMind

雖然迄今為止只有十幾種藥物在研發過程中使用了人工智能技術，但這一數碼在未來可能會迅速增長，未來的藥物研發會越來越像一個計算問題。當數據科學、人工智能和自動化相結合時，生物學將變得工程化，有可能出現指數型改進。

AI 將改變藥物發現過程的每一步，雖然它可能是一種漸進式的改進 ——這裏提升10%，那裏20%、30%，但最終將所有這些改進相乘，速度和成功率就可以提高兩到三倍。

今天這篇文章，我們就來聊聊AI在制藥方面到底能做什麽？最大的瓶頸——數據，會帶來哪些問題？以及AI制藥更可能會是一種漸進式的變革，而非突變式……Enjoy：

AI在制藥方面到底能做什麽？

但為什麽現在還沒有獲批藥物，是透過AI方式做出來的？

AI在制藥方面到底能做什麽？

我們先說一個真實案例。

幾年前，在奧利地維也納醫科大學，一名82歲的病人（保羅）患有一種侵襲性血癌，他已經做了六個療程的化療，但都未能根治。在這個漫長且痛苦的治療過程中，醫生不得不把那些常用的抗癌藥一個一個劃掉，因為它們都沒有起到作用。

最終，保羅參與了一項藥物試驗，一家英國公司Exscientia正在開發一種新型的配對技術，能根據不同患者的細微生理差異，為他們配對所需的精確藥物。

研究人員從保羅身上提取了一小塊組織樣本，將包括正常細胞和癌細胞在內的樣本分成一百多塊，並將它們暴露在不同的藥物組合中。然後，他們利用機器自動化和電腦視覺，這是一種經過訓練的機器學習模型，可辨識及預測細胞中的微小變化。

實驗證明，有些藥物不能殺死保羅的癌細胞，有些藥物反而損害了他的健康細胞。最終，這項技術找到了一款抗癌藥物，而此前保羅的醫生沒有嘗試過它，因為往期的試驗表明，這種藥物對治療這種類別的癌癥無效。

最終這款藥物成功了。兩年後，保羅的病情完全緩解，他的癌癥消失了。而如果采用傳統的辦法，實驗的速度和規模不可能這麽快。

當然，在這個已經成功的案例裏，機器學習只做到了篩選出正確的藥物，這也只是這家英國公司Exscientia的一個小目標，真正的目標是徹底改變整個藥物開發流程，利用人工智能技術設計新藥。

但這個目標還未實作，這是目前整個生命科學界和AI界都在探索的方向。我們希望透過AI和數據驅動的方法，註入更強算力，來提高藥物研發中的成功率。

我們先來看看研發一款新藥（這裏主要指小分子藥物）的基本步驟是什麽，再來說AI能切入哪些環節。首先，研發人員需要在人體內選擇一個藥物會與之發生作用的靶點，例如蛋白質；然後設計一種分子，對該靶點起作用，比如改變它的工作方式或讓它停止工作。接下來，在實驗室中制造出這種分子，並檢查它是否真的起了作用，並且這個作用是設計所需的作用，而不是其他作用。最後，在人體中進行測試，看它是否安全有效。

幾十年來，研發人員們篩選候選小分子藥物的方法是，將所需靶點的樣本放入實驗室的許多小格子中，加入不同的分子，觀察反應。然後多次重復這一過程，調整候選藥物分子的結構，比如把這個原子換成那個原子，如此反復，這裏面依賴的都是研發人員的經驗和直覺。

但從實驗室到人體並不容易，許多藥物分子在實驗室中似乎很有效，但最終在人體中進行試驗時卻失敗了。所以這裏面需要大量修改的工作，比如脂溶性不好，就需要修改與脂溶性相關的地方；如果有毒副作用，就需要修改相應的地方克服掉。

新藥研發其實就是一個不斷叠代、修改的過程，最後經過實驗驗證，走向臨床、上市，產生價值。從經驗來看，研發人員可能需要設計和測試20種藥物，才能最終選出一種有效的藥物，這導致研發成本非常之高。

在這個過程中，AI能切入的主要是兩個環節：

第一是在最初選擇苗頭化合物時，就透過AI去篩選。傳統方法是依賴於研發人員的經驗和直覺，只能在一個幾百萬級的化合物庫中去搜尋和篩選。據測算，如果剔除一些非常相似的分子，所有的大型制藥公司比如默克、諾華、阿斯利康等等加在一起，最多能有1000萬個分子可以用來制造藥物，其中有些是專有的，有些是眾所周知的。這就是大量化學家在過去百年辛勤工作的總成果。

但自然界中的化合物，或者說成藥空間，有10的60次方，我們實際上只是在一個非常小的範圍內搜尋。如果強算力的AI能夠在更大的範圍內搜尋，那就能大大突破目前的探索空間，找到更合適的成藥化合物。

這是人工智能的真正潛力所在——開啟一個巨大的生物和化學結構庫，這些結構可能成為未來藥物的成分。

第二是在對先導化合物的修改時，運用AI技術修改。在選擇完苗頭化合物後，形成先導化合物，但有很多地方往往需要修改，比如需要把活性修改得更好，或是要把成藥性改得更好，這個環節在藥企研發中可能占了90%的工作量。

如何修改這些分子呢？由於藥物研發已經有了上百年的歷史，我們已經記錄了很多結構的作用，基於這些再去做創新會容易一些。打個比方，這個過程像是要把一幅畫改得更漂亮，但是目前這幅畫中的某一部份，已經畫得還不錯，此前也已經被實驗驗證過了，那就可以保留，在這個基礎上修改。

而經過訓練的AI大模型，它可以從數十年間的幾百萬篇論文和大量檔案中挖掘數據，從這些檔中提取出知識圖譜——哪些改變會導致什麽樣的結果，這樣的因果鏈對修改非常重要。

基於這樣的數據基礎，然後就可以讓AI去把其他部份設計出來，讓AI發揮想象力。AI往往比人類專家的想象力更加豐富，人類專家往往只能畫出幾十個分子，而AI生成的數量是沒有上限的，只要算力支持。

並且，在修改中需要同時考慮很多影響因素，比如合成性、活性、成藥性等等，是一個多重目標的復雜問題。人類專家在處理時，往往是簡化，一次只處理一個環節，比如在這個環節只考慮活性，在另外一個環節才去考慮成藥性。但AI能夠更好地處理多重資訊。

拿比較重要的成藥性來舉例，比如一款口服針對腫瘤的藥物，它要想進入體內後可以治愈腫瘤，首先需要經過消化系統，然後進入血液和細胞，這個是吸收、代謝的過程；其次藥效需要持續一段時間，並且不能有毒副作用。這些性質統稱為成藥性，是藥物研發中很重要的因素。

以往研發人員主要依賴實驗驗證，這就導致有可能在之前的研發環節花了很多錢，做了很長時間，好不容易發現了一個有效分子，但在成藥性驗證上出了問題，而導致重新做或是放棄，這就造成了「雙十原則」。

如今則可以透過AI+專家經驗+自動化實驗的方式，透過AI提升預測的準確率和設計出更結構新穎、性質更好的分子，來提升整體成功率。有研發人員將藥物和蛋白質在體內的相互作用，視為一個物理問題，模擬原子間的推拉作用，而這種推拉作用會影響分子如何結合在一起，利用人工智能更準確地模擬分子之間的相互作用。

生成式 A I 對生命科學各環節的作用及經濟價值推動 ；圖片來源：麥肯錫

但為什麽現在還沒有獲批藥物，是透過AI方式做出來的？

不過，與AI制藥偉大潛力相對應的是一個冰冷的事實，目前還沒有任何一款獲批的藥物，是透過AI的方式做出來的。

「如果有人告訴你，他們可以完美預測哪種藥物分子可以透過腸道或不被肝臟分解，諸如此類，那麽他們很可能也有火星上的土地要賣給你。"MIT Review曾經采訪了一位該領域的專業人士。

如今橫在AI制藥技術面前最大的難題是數據，由於生命科學領域的數據非常不標準化，特別是在實驗領域，經常會出現A實驗室做出來的實驗，與B實驗室做出來的實驗壓根沒有可比性。該領域甚至有一個常用語——「Apple to Apple」或者「head to head」，來特別強調可比性。

一旦涉及對真實世界的數據采集，最大的問題就是如何采集足夠多的數據維度。不管是研究細胞還是研究人、動物，一般在傳統生物學、醫學的視角裏，采集的都是單點數據，比如這只猴子是胖還是瘦、這個細胞是增殖還是死亡，但這些維度過於單一，對胖瘦、增殖還是死亡的影響因素其實非常多，如果我們缺乏足夠多的觀察手段，以及不能形成多維度、結構化的數據，那麽對AI進行的訓練也就會大打折扣。

以及這些數據從哪裏來？並不一定是大型藥企，因為以前的數據記錄方式不一定能復用。曾經在自動駕駛領域就有一個經典例子：當我們去尋找可供模型訓練的數據時，很多人最初找到出租車公司，因為出租車都配有行車記錄儀，理論上應該有很多自動駕駛的數據。但實際上大家發現不行，因為出租車缺乏多維度的數據記錄，雖然行車記錄儀的數據有很多，但並不知道當某個路況發生時，司機做出了什麽動作，比如怎麽打方向盤、什麽時候踩了剎車，原來的行車記錄儀並沒有足夠的傳感器去記錄這些內容。所以現在的自動駕駛公司，為了采集多維度的數據，都必須在測試車裏加裝很多傳感器。

如今在生命科學領域也一樣，雖然不一定要完全從零開始，但目前的行業數據庫肯定是不夠的，需要加入各種新維度，包括加標準、加定義、加新的「傳感器」等等，需要圍繞AI訓練所需，把各種維度補全，才能夠有訓練好AI的基礎。

而如果從AI大模型scaling law的角度，現在還沒有人知道一個足夠智能的生命科學大模型，到底在哪個範疇上才能夠達到湧現？在沒有足夠高質素的數據、沒有達到scaling law生效前所做出來的AI，歸根結底可能只是overfitting（擬合過度），還無法達到真正的突破。至於這個scaling law的突破點在哪裏？仍然還處於探索中。

除了數據原因之外，另一大原因是AI也不是萬能的，無論研發環節多麽先進，藥物仍然需要進行人體臨床試驗。任何藥物研發的最後階段，都需要招募大量誌願者，這很需要時間，平均約10年。許多藥物需要花費數年時間才能進入這一階段，但仍然以失敗告終。

雖然有很多AI制藥公司都在加班加點地研發，但這些實驗室中的實驗和人體臨床試驗無法被縮短，所以第一批在人工智能幫助下設計的藥物，可能還需要幾年時間才能上市。

當然，雖然AI無法加快臨床試驗的行程，但它確實可以幫助制藥公司減少試錯成本，也就是減少在實驗室中測試無效藥物分子所花費的時間，讓有希望的候選藥物更快進入臨床試驗階段。而且，由於資金投入的減少，公司可能不會感到那麽大的放棄壓力，而堅持想碰碰運氣。

如今正有越來越多的由AI輔助的藥物管線出現。根據智藥局統計，AI輔助的臨床管線已經從2022年的50條，增長到當前的102條，這還僅僅是統計的AI制藥公司的管線情況。

一級市場的資金也正在往該領域聚集。比如在上個月，生物技術領域最大的投資機構ARCH Venture Partners，做出了有史以來最大的一筆投資，單筆領投了2億美元，投資於AI+醫療創業公司Xaira。這家成立僅一年的創業公司，在種子輪就拿了10億美金，目標是利用 AI 來重塑藥物的研發、尋找治療疾病的新藥。

輝達對Biotech的投資

當我們在討論AI制藥的未來時，它更像是一場漸進式的變革，而非突進式的變革。

這一輪AI熱潮與此前電腦輔助制藥最大的不同在於，算力和演算法已經得到了顯著提升，相比之前已經產生了代際差異，這為藥物發現和設計提供了前所未有的精確度和效率。

由於數據問題，以及AI無法觸達的臨床試驗等耗時環節，至今仍未有獲批藥物是透過AI方式做出來的。但AI制藥的真正價值，可能不在於它能夠立即創造出超越現有藥物的奇跡，而在於作為一種工具，能夠系統性地解決以往難以解決的問題。這種系統性的解決方案，而不是偶發性的一兩次成功，如果能夠實作，將是對傳統制藥方法的一次重大突破，有可能帶來制藥行業的革命。

最新的研究裏程碑也證明了這一點。華盛頓大學生物化學教授David Baker的研究團隊，首次利用AI技術從零開始設計出了一種新型抗體，將抗體療法推向了一個全新的高度。雖然尚未達到人類設計的頂尖水平，但已經證明了AI設計的蛋白質是可行的，這為未來的發展奠定了基礎。

最後，如果我們用一句話總結：「AI在大分子領域的潛力值得期待，但這個積極樂觀可能不是在一個2-3年的時間周期裏，而是更長的、漸進式的發展周期裏。」在古代，藥物發現純粹靠運氣；在近代，藥物發現依賴經驗和直覺；在未來，AI技術料將大大加速這一行程——這裏提升10%，那裏20%、30%，最終將所有這些改進相乘，速度和成功率就可以提高兩到三倍。

References：

1. EndPoints：Cash, chips and talent: Inside Nvidia's plan to dominate biotech's AI revolution

2. 國聯證券：醫療AI賦能醫藥產業新發展

3. The Economist：Big pharma is warming to the potential of AI

4. MIT Review：AI is dreaming up drugs that no one has ever seen. Now we’ve got to see if they work.

5. Reuters：Big Pharma bets on AI to speed up clinical trials