加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 院所动态新闻 > 工作动态

上海高研院在mRNA药物递送系统脂质纳米颗粒(LNPs)人工智能预测方面取得突破性进展

发布时间:2024-05-21 【字体: 】【打印】 【关闭

mRNA疫苗靶向治疗泛癌症是当前药物研究的热点,具有重大学术和经济价值。mRNA设计中的重要挑战是递送系统脂质纳米颗粒(LNPs)的构建,作为把mRNA治疗药物或疫苗送达靶细胞的载体,LNPs组分筛选制备存在周期长、成本高的难题。以Chat GPT为代表的新一轮人工智能技术正推动人类社会全面变革,通过人工智能模型辅助药物分子和物质组分设计,结合实验测试迭代,驱动规模化药物发现,针对mRNA-LNPs,利用人工智能技术跨学科交叉,对快速设计自主高转染效率的mRNA-LNPs具有重要意义。 

近日,中国科学院上海高等研究院(以下简称“上海高研院”)人工智能团队刘立庄研究团队在mRNA药物递送系统脂质纳米颗粒人工智能预测方面取得突破性进展,提出了一种基于mRNA-LNPs三维微观结构与生化性质间映射的自注意力机制深度学习模型,实现了LNPs高精度自动筛选,结果优于目前公开发表方法,相关研究成果以“Data-balanced transformer for accelerated ionizable lipid nanoparticles screening in mRNA delivery”为题发表在国际生物信息期刊Briefings in Bioinformatics上。

本研究设计基于mRNA-LNPs三维微观结构与生化性质间映射的自注意力机制深度学习模型,称为TransLNP(图1)。TransLNP采用跨分子类自动学习方法(图2),提取其他已有分子数据积累的知识,实现针对LNPs的小样本训练学习,从而实现不同分子类之间算法模型的迁移。为构建mRNA-LNPs三维微观结构与生化性质间映射关系,充分利用粗粒度原子序列信息和细粒度原子空间对应关系,基于自注意力机制的原子信息(原子类型、坐标、相对距离矩阵、边类型矩阵)交互,提取分子级特征。此外,针对有限的LNPs数据造成的不平衡问题,设计BalMol(balance molecule)模块,通过平滑标签分布和分子特征分布来平衡数据。TransLNP实现LNPs转染效率预测均方误差MSE<5,对比现行主流的多种图卷积神经网络和机器学习算法相比,结果显示(图3),在均方误差、决定系数R2和皮尔逊相关系数评价指标中性能最优,指标达到该领域一流水平。

图1 TransLNP架构图

图2 跨分子类自动学习架构图

图3 TransLNP与多种图卷积神经网络和机器学习算法预测结果对比图

该工作实现快速精准预测mRNA-LNPs的转染效率以及新脂质纳米颗粒结构预测,新方法将推动mRNA药物在基因治疗、疫苗开发和药物递送等领域的应用发展。上海高研院硕士研究生武坤为本研究论文第一作者,上海高研院刘立庄正高级工程师为通讯作者,联合了国家蛋白质科学研究(上海)设施李娜正高级工程师,日本筑波大学王梓旭博士共同完成。

文章链接: https://doi.org/10.1093/bib/bbae186