AI的翅膀开始嫁接到各行各业,其中就包括医疗行业。最近,众多科技巨头如微软、英伟达和谷歌等,都加大了「AI+医疗」的布局。比起传统研发进程,AI能够在较短时间内处理大量复杂数据,AI可以提高药物研发效率,加速药物筛选。不过,通过AI大模型完全模拟对算力的要求极高,足量的训练数据仍然是一大瓶颈。
多家公司入局
当地时间5月8日,谷歌DeepMind及姊妹公司Isomorphic Labs旗下的AI药物研发模型AlphaFold官宣重磅升级,称最新版本AlphaFold 3可以预测蛋白质、DNA、RNA等生物分子的结构以及它们如何相互作用。
Alphabet兼谷歌CEO Sundar Pichai表示,目前,已有180多万名研究人员在疫苗开发、癌症治疗等研究工作中使用AlphaFold进行蛋白质预测。在接受采访时,Isomorphic Labs的CEO Demis Hassabis表示,人工智能系统有可能彻底改变医学,并创造「巨大的商业价值」。
盯上这条赛道的不止谷歌一个。美国的众多科技巨头已经感触到「AI+医疗」的市场机会,纷纷加大布局。英伟达创始人兼CEO黄仁勋曾多次强调,数字生物学将是「下一场惊人的颠覆性技术」。诚如他所说,今年3月英伟达举办的2024GTC大会上,医疗健康仍是「重头戏」之一,与生命科学相关的会议活动排在所有行业之首。
过去两年间,英伟达旗下AI药物研发平台BioNeMo的风投部门Nventures把大部分钱都投给了药物研发项目。数据显示,Nventures的19笔投资交易中有7笔是投向AI药物研发初创公司。
最近,公司还投资了一家机器学习药物研发初创公司Relation Therapeutics。整个2023年,英伟达投资了9家专注于药物研发领域的科技初创公司。英伟达医疗健康副总裁Kimberly Powell直接表示:「医疗健康将成为英伟达下一个数十亿美元级业务。」
其他几家科技巨头也发力药物研发领域。仅在去年一年中,Salesforce推出了蛋白质生成AI大模型ProGen,微软发布了一个类似的开源模型EvoDiff,亚马逊还为其AWS机器学习平台SageMaker发布了蛋白质折叠工具,据报道,甚至连字节跳动也在招聘科学和药物设计团队。
投资热情
「AI+医疗」如今已经成为一片热土,吸引各方关注。IDC一项研究显示,79%的医疗保健组织正在使用AI技术。在媒体采访中,谷歌DeepMind、英伟达的高管都表示,可用的大量训练数据、计算资源的爆炸和AI算法的进步,这三大因素共同激发了AI在药物研发上的潜力。这同样激发了投资热情。
根据Pitchbook的数据,自2021年以来,全球AI药物研发初创公司的风投交易已有281笔,投资额达到77亿美元。另据Global Market Insights报告,预计「AI+医疗」市场的年均复合增速将超过29%,2032年将达到700亿美元。药物研发和医学影像成为AI应用最重要的两个领域,市场份额占比合计超过50%。
比起传统研发,AI制药以医药大数据为基础,将人工智能技术应用到制药各环节,提高新药研发效率及质量,降低研发成本。中商产业研究院研报分析指出,AI技术如今主要用于药物研发阶段,随着技术的不断突破和发展,AI技术参与制药的环节将增多,新药研发效率也将提升。
「2010年到2021年,全球由AI参与的药物研发项目从最初的6个增长到158个。最近的一项调查研究显示,由AI参与的药物研发管线,无论是新靶点、新机制的First-in- class(首创新药)药物研发,已知靶点的Best-in- class(同类最佳)药物研发,还是Drug Repurposing(老药新用)的研发,AI均可以很大程度地加速药物研发流程,降低药物研发整体成本。」全球健康药物研发中心数据科学部负责人郭晋疆表示,AI可以参与药物研发的每一个环节,包括疾病关键靶蛋白的确立和验证,小分子/疫苗/抗体的设计与优化、中后期的毒性和安全性评估等各个环节,AI都可以赋能和协助加速药物研发进程。
美国依然是「AI+医疗」最为火热的区域。据统计,目前全球AI药物研发企业约343家,其中超过50%集中在美国,英国和欧盟分别占据12.5%和13.4%,亚洲大约为12.8%。
麦肯锡全球研究所(MGI)估计,生成式AI每年可为制药和医疗行业带来600亿至1100亿美元的经济价值。英伟达方面透露,使用AI技术可使药物早期发现所需时间缩短至1/3,成本节省至1/200。
此外,跨国药企积极拥抱AI技术带来的变革。目前全球排名前20的药企,如辉瑞、强生等巨头都已经布局AI+新药研发。2023—2024年2月,有公开金额的跨国药企与AI药物研发企业合作项目,潜在总额超过120亿美元,平均值为8.4亿美元。
还未落地
虽然将AI应用于药物研发的潜力十足,但距离真正进入医药市场仍有很长的路要走。业内分析表示,通过AI大模型完全模拟药物研发的这一过程对算力的要求极高,足量的训练数据仍然是一大瓶颈。合成生物学公司Ginkgo Bioworks的AI负责人Anna Marie Wagner表示,像GPT这样的新型基础模型依赖于强化学习,是一种模仿人类为实现目标而反复训练的学习过程,更依赖于高质量的海量数据。
到目前为止,尚未有AI辅助研发的新药上市。有数据显示,全球有超80款AI药物进入临床试验阶段,大多数处于临床早期阶段,仅有少数进入Ⅱ期临床试验,还有部分AI辅助研发的药物因临床表现不佳而终止。
今年4月,英国AI药物研发公司BenevolentAl宣布,用于治疗特应性皮炎的局部泛Trk抑制剂BEN-2293的Ⅱa期临床试验没有达到次要疗效终点,该药曾被认为具备潜在同类最佳潜力。
郭晋疆指出,生命科学领域的数据呈现出多模态、多尺度、异质化的特征,既有来自于基因测序的数据、蛋白质或化学化合物结构化的数据,也有来自于生物活性的特定数据等,数据量初步估算为百亿级。而AI缺乏对生物体系机制的认知,对不同尺度、不同层级的生物学数据缺乏系统性理解,如蛋白构象变化、分子以及药代动力学过程等时间、空间尺度信息。
「从合作模式而言,如何构建一个有效的闭环很重要。AI算法和实验之间的闭环,不仅仅存在技术上的难度,还有互信的难度。」微软研究院科学智能中心首席研究员夏应策认为,应建立有效的机制,让AI的专家愿意为实际问题针对性地设计算法,实验组的化学专家们也愿意为AI设计出来的分子进行评估和测试。
DeepMind的科学副总裁Pushmeet Kohli更是直观地形容数据量的痛点:「垃圾进,垃圾出。」据报道,美国食品药品管理局(FDA)迄今为止已经批准了100多种使用AI或机器学习进行开发的药物候选物的临床试验,但可能需要数年时间才能上市。
北京商报记者 赵天舒