当前位置: 华文世界 > 科技

Owkin融合空间组学与AI技术,或创建全球最大癌症空间组学数据集

2024-02-10科技

据了解,美国 Owkin 公司正在致力于生成大型数据集。2023 年 6 月,该公司发起了一项倡议,旨在创建全球最大的癌症空间组学数据集,即针对七种难以治疗的癌症,征集来自 7000 名患者的数据集。

在这项名为癌症多组学空间图谱(MOSAIC,Multi-Omics Spatial Atlas in Cancer)的项目中,通过生成数据以及挖掘数据,研究人员寻找和确定了能用于设计新药的靶向分子。

为了推进这一倡议,Owkin 公司正在进行多项准备,并将充分利用庞大的合作医院网络。据了解,在 MOSAIC 创建数据集的项目中,该公司正在与五家世界级的癌症研究医院展开合作。

该公司在 AI 方面也有着一定经验,过去五年间其累计发表 54 篇研究论文,有的论文提出了基于 AI 的创新方法,有的建立了包括多种癌症在内的疾病预测模型。

同时,该公司也正开发新的方法,利用空间组学技术来识别新的治疗靶点和患者亚群。利用这种前沿性的方法,通过肿瘤活检图像,就可以了解患者病情发展与肿瘤异质性之间的关系。

凭借此前积累以及 MOSAIC 的合作联盟,Owkin 公司正在开发下一代 AI 方法,来建立分子层面的有关疾病异质性的理解、以及与患者病情发展的联系。

总之,在本次项目之中,该公司将空间组学和 AI 加以了良好结合。空间组学被 Nature Methods 杂志评为「2020 年度方法」,并与生成式 AI 一起被世界经济论坛评为「2023 年十大新兴技术之一」。

(来源:AI 生成)

人体细胞数量有 37 万亿,这些细胞是如何协同工作从而维持生命的?这一问题可能是生物学最大的未解之谜。

一系列新兴的空间分辨多组学技术即空间组学技术,或将会为破解上述谜团提供解决方案。

过去 20 年,组学技术革命性的发展让我们能以越来越高的分辨率理解细胞和组织生物。而 2000 年代中期出现的混合测序技术,则让研究混合细胞群体成为可能。

十年后,用于单细胞的组学方法被允许投入商用,这使人们对细胞生理学和病理学的理解彻底改变。不过这些方法都必须先将细胞从其来源组织中分离才可以实施,面对细胞组织的空间架构等课题则显得束手无策。

空间组学这一学科所研究的,正是对 RNA、DNA、蛋白质和其他组学等生物分子的活动进行原位测量,也就是直接在组织样本中进行测量。

无需将细胞从组织中分离便可测量,这一点可谓至关重要,尤其是考虑到许多生物过程是由细胞之间高度局部化的相互作用所控制的,因此这些相互作用发生于空间异质的组织环境中。

而空间组学的面世,让此前观察不到的细胞组织和各种生物过程的细节成为可能。

尽管在几年前,这些技术还仅能在全球少数几个实验室找到,且都是原型技术的状态。当时也还只能对冷冻组织进行研究,因此需要大量的珍贵组织活检。

但随着以上挑战逐渐被克服,再加上生命科学公司的努力,该技术最终实现了商业化,目前这些工具已在学界得到了广泛应用。

空间组学技术目前正在快速发展,它可以分析的生物分子数量已从数百个增至数万个,分辨率也已提高到单细胞甚至亚细胞结构的尺度。

数据与 AI 的互补式进步,将使空间组学在生命科学和医疗保健领域的影响不断扩大,同时也提出一些新的相关疑问。

比如,该如何生成用于临床研究的大型数据集?从空间组学的数据中,AI 又能发现什么?

受益于空间组学的发展,生命科学的几个细分领域已经迎来突破性进展,尤其是癌症和神经退行性疾病研究等。但空间组学技术仍是一项新兴技术,不仅实验很有挑战性,执行成本也很高昂。

目前,空间组学的大多数研究均由单一机构执行,通常只包括几十名患者。而复杂的细胞相互作用,又存在因患者而异的特点,仅通过数量较少人群的调查往往无法得出结论。研究人员需要大量数据才能生成和探索更多的假说。

这意味着人们需要将重心更多地转向合作,只有这样才能生成有关健康器官和人类疾病的大规模参考数据集。例如癌症基因组图谱(TCGA,The Cancer Genome Atlas)项目,让人类对于癌症的理解有了巨大改观。

此外,为了探索空间组织在健康组织和患病组织中的作用,也需要大规模的空间组学研究,只有这样才能生成大型数据集,并为相关科研项目提供原料素材。

同时,更多的合作项目也能起到促进空间组学技术进步的效果,尤其可以为数据存储库生成更多的数据标准和基础设施,并可以推进计算工具和算法的开发和应用。

随着空间组学和 AI 技术的协同发展,AI 驱动的空间组学有望带来更多的生物学新发现。纵观空间组学和 AI 方法的快速发展,该领域两大类新方法正产生巨大的突破。

第一类是用于提高空间组学可用性的 AI 方法,这可以为研究人员提供更丰富的下游分析。这类方法是专门针对空间组学高维度和信噪比的特点而设计的。

另一些则通过 AI 将空间组学分析的分辨率提高到接近单细胞的水平,它们也被统称为「超分辨率方法」。还有一组方法可以将分离的单细胞组学与空间组学相结合。总之,这些 AI 方法将不断缩小与未来空间组学技术的差距。

第二类方法则主要通过 AI 来从空间组学中进行新的生物学探索。例如利用空间组学的定位信息,人们能以前所未有的分辨率展示细胞群的组织和交流。这些方法将让我们更好地了解细胞的相互作用、以及形成复杂组织的背后机制。

总的来说,空间生物学或将从根本上改变人类对生物学的理解。例如对于生物标志物的认知,可能从之前样本中的某个特定分子,将转变为组织中表达特定分子的细胞模式。

针对包括阿尔茨海默病和卵巢癌症在内的多种疾病,空间生物标志物有着广阔的前景。在当前的临床试验研究中,空间组学已被用于监测患者的肿瘤进展。

五年后,空间技术或将能以亚细胞尺度的分辨率来绘制每一种人类蛋白质、RNA 和代谢产物。

通过 Owkin 公司的 MOSAIC 等项目的努力,针对「难治型」癌症的肿瘤微环境和细胞组成图的绘制工作将不再是一件难事。

来自患者活检的空间组学数据集也将成为药物研发的重要部分,通过 AI 这些数据集将能用于设计新药,并促成速度更快、设计更优的临床试验,从而造福于患者。

未来在临床中,还将定期从患者收集空间组学数据,医生将通过专门构建的 AI 模型来提取患者肿瘤的相关临床信息,并判断哪些药物最有效果。

总之,今天我们正在见证三股力量的融合:空间组学技术正变得越来越高通量和高分辨率,来自患者活检的大规模数据集开始生成,AI 模型也越来越「高级」。

通过这种融合,研究人员将能对健康和疾病的复杂生物学进行前所未有的分析,从而实现更复杂的治疗干预。

支持:vantee

排版:罗以