营养与健康所生物医学大数据中心合作发布合成生物学元件与数据库

文章来源:上海营养与健康研究所  |  发布时间:2024-10-11  |  【打印】 【关闭

  

10月3日,国际学术期刊Nucleic Acids Research在线发表了中国科学院上海营养与健康研究所生物医学大数据中心张国庆研究员与中国科学院分子植物科学卓越创新中心周志华研究组的合作论文“RDBSB: a database for catalytic bioparts with experimental evidence”。该研究构建了首个面向合成生物学设计的催化元件数据库RDBSB,提供了83,193个具有实验证据的催化元件在线查询平台(https://www.biosino.org/rdbsb),同时还提供了PathFinder工具,可以根据底物和目标产物设计相应的合成途径,并能完整复现例如晚期肝细胞癌的治疗药物淫羊藿素和棉铃虫性信息素的人工合成途径设计过程。

催化元件是设计、构建和优化特定代谢途径乃至生命系统的基础,一个可靠的、经过实验验证的催化元件数据库对于设计和优化这些生命系统至关重要。而现有的生物元件库缺乏底盘、催化反应最佳pH和温度等对合成过程至关重要的信息。为了填补这一空白,研究团队从各种数据库整合了总计390,708个催化元件,通过审编后得到了83,193个有实验验证的催化元件,包含大量的转移酶、水解酶和氧化还原酶(图1A)。其中,3200个催化元件包括最适催化反应温度(20°C至40°C)、最适pH值(6-9)等关键信息(图1B)。这些催化元件大部分来源于细菌、后生动物和植物(图1C)。

基于此,研究团队设计并构建了合成生物学元件和数据库(以下简称RDBSB),在线提供系统审编的定性和定量催化信息,包括元件的活性、底物、催化反应最佳pH值和温度以及底盘特异性等关键参数。平台还提供了包括MapView、AlphaFold、PVQD和PathFinder等在内的丰富的在线元件和途径设计工具。通过RDBSB,用户不仅可以在线搜索并查阅催化元件详细的定性和定量信息及其对应的参考文献,还可以提交新的催化元件,促进数据的快速共享与利用。截至目前,RDBSB已为一千多个催化元件共享提供了支撑。该数据库将极大丰富合成生物学途径设计的可用资源,为研究人员提供必要的工具。

中国科学院上海营养与健康研究所生物医学大数据中心高级工程师刘婉、博士研究生庄心昊、中国科学院分子植物科学卓越创新中心副研究员王平平为论文共同第一作者。中国科学院上海营养与健康研究所张国庆研究员和中国科学院分子植物科学卓越创新中心周志华研究员、严兴研究员为论文共同通讯作者。该研究得到了科技部国家重点研发计划、中国科学院战略性生物资源服务网络计划等项目的支持。

文章链接:https://academic.oup.com/nar/article-lookup/doi/10.1093/nar/gkae844

图1:RDBSB数据概况。(A)催化元件在ENZYME数据库分类的分布情况。(B)经实验验证的催化元件在酶类别、底盘、最佳pH值和最佳温度的分布。(C)根据NCBI分类法分类的元件来源生物的分布情况。

图2:RDBSB在线分析和设计功能。(A)GmOMT2的MapView示例。视图提供催化元件、底盘、物种和化合物之间的关系。(B)利用PVQD和AlphaFold对GmOMT2进行三维构象和结构预测。(C)PathFinder复现人工生物合成途径设计的实例:酵母中晚期肝细胞癌治疗药物淫羊藿素的人工合成途径和棉铃虫性信息素的人工合成途径。