癌症具有高度异质性,不同病人使用同样药物治疗的效果可能有很大差别。据估计,美国食品药品监督管理局(Food and Drug Administration,FDA)已批准药物的响应率约在20%至80%之间,此外还有毒副作用和获得性耐药的问题。个体化用药和联合用药能达到提高疗效、减少毒副作用、降低耐药性的效果,是癌症精准用药研究的重要任务,亟需基于大数据的计算模型提供支撑。
中国科学院上海营养与健康研究所李虹研究组多年来在抗癌药物疗效建模方向持续深耕,发表了基于分子组学预测药物响应和肝癌药物基因组相关的系列论文【Cancer Cell 2019, 36(2):179-193;Int J Cancer 2020, 146(6):1606-1617;J Genet Genomics 2021, 48(7):540-551; Brief Bioinform 2023, 24(1):bbac605】。但前期研究表明肿瘤用药的计算分析仍存在诸多挑战,例如:肿瘤临床前模型和病人存在差异,计算模型缺乏泛化能力;药物组合的作用机制复杂搜索空间大,对药物联用协同效果的准确和稳健估计仍很困难。为了解决这些问题,李虹研究组近期发布了两个新的人工智能模型。
10月18日,李虹研究组在国际学术期刊Bioinformatics在线发表题为“Dual-view jointly learning improves personalized drug synergy prediction”的研究论文。论文构建了一个双视图深度学习模型JointSyn来预测药物组合的协同效应(图1)。JointSyn在各种基准的预测准确性和稳健性方面均优于现有的最先进方法。进一步的分析表明,双视图模型相比单视图更擅长区分协同与拮抗药物组合。每个视图能够捕获不同的协同作用特征,并在最终预测中发挥互补作用。此外,微调后的JointSyn在少量实验数据条件下提高了预测新药物组合和癌症样本的泛化能力,展示了其强大的泛化性能。文章最后使用JointSyn生成了泛癌药物协同作用的估计图谱,并探索了不同样本之间的差异模式。这些结果证明了JointSyn预测药物协同作用的能力,可以为更好的实验设计提供定量建议,也为个性化组合疗法的开发提供有力支持。营养与健康所博士生李学良为该论文的第一作者,李虹研究员为通讯作者。
10月24日,李虹研究组在国际学术期刊Journal of Pharmaceutical Analysis在线发表题为“A disentangled generative model for improved drug response prediction in patients via sample synthesis”的研究论文。论文提出了一种用于药物响应预测的新型解耦合成网络DiSyn,有效地将肿瘤细胞系模型上提取的知识泛化到患者数据,在药物响应预测方面达到最先进的性能(图2)。DiSyn旨在从标记良好的源域数据(肿瘤细胞系)上构建药物响应预测模型,并将其应用于缺乏标签的目标域(癌症患者)。其核心策略是从输入数据中分离出与药物响应相关的特征,并通过合成样本来提高模型在目标域的预测准确性。通过在解耦和合成之间进行迭代,确保模型在目标域中不断提高其性能。在TCGA、I-SPY2和NIBR PDXE三个目标数据集上的验证结果表明:基于癌症细胞系构建的DiSyn模型用于患者和小鼠时取得了优于其它方法的准确性。此外,DiSyn在乳腺癌患者中的应用案例也展示了其在生物标志物发现和药物组合探索中的潜在价值。营养与健康所博士生李坤实和博士生沈碧寒为该论文的共同第一作者,李虹研究员为通讯作者。
以上研究得到了国家自然科学基金、上海市自然科学基金和中国科学院青年创新促进会等项目的资助。同时也得到了海军军医大学国家肝癌科学中心、营养与健康所生物医学大数据中心高性能存储与计算平台的支持。
文章链接:
https://doi.org/10.1093/bioinformatics/btae604
https://authors.elsevier.com/sd/article/S2095-1779(24)00225-9
图1:双视图联合学习JointSyn提高药物组合协同性能预测
图2:基于解耦与合成的DiSyn模型改进抗癌药物疗效预测