科学家创建新的全基因组分析方法并发现人类在早、中更新世过渡期经历严重的群体瓶颈

文章来源:  |  发布时间:2023-09-05  |  【打印】 【关闭

  

 

9月1日,《科学》(Science)在线发表了中国科学院上海营养与健康研究所李海鹏研究组与华东师范大学脑功能基因组学研究所潘逸萱研究组合作撰写的题为Genomic inference of a severe human bottleneck during the Early to Middle Pleistocene transition的最新研究成果。该研究创建了快速极小时间溯祖(FitCoal)新理论,并发现了人类在早、中更新世过渡期由于气候环境的急剧变化经历了严重的群体瓶颈,人类祖先近乎灭绝。

史前人口数量的变化,综合反映了该时期气候环境的变迁,因而通过群体遗传学的研究方法进行回溯,可以更深入地了解现代人类的形成。已有化石记录表明,最近100万年是人类进化的关键时期,但人类群体历史的研究多局限于最近的30~10万年内。虽然近年来古DNA测序技术迅猛发展,但由于炎热条件不利于DNA的保存,无法从30万年前非洲人类祖先化石中提取古DNA。因此,该研究通过群体遗传学新理论分析现代人群基因组,探索百万年前的群体历史。

史前虽然没有文字记载群体数量,但有效群体大小会影响每个世代的溯祖率,也就是两个谱系在上一世代来自同一祖先的概率。因此,人类祖先曾在群体基因组中留下印记,反映当时的群体大小。群体历史越久远,留存至今的印记信号越微弱。为准确解读这些信号,进而准确估算百万年前人类群体历史,科研人员创建了群体遗传学和计算生物学新理论,快速极小时间溯祖FitCoal。遵循这一理论进行数学推导,该工作获得在任意群体模型下各突变类型(即突变频谱)对应溯祖树枝长期望值的解析解,并获得精确的似然值,即在群体历史条件下观察到样本突变频谱的概率。因此,无需事先获得群体历史的先验知识,FitCoal即可自动快速搜寻出极大似然值,从而估算群体历史,对古人类群体进行“人口普查”。

研究人员通过设定群体历史模型(true model)并分析模拟产生的DNA多态数据,衡量估计群体历史的无偏性和95%置信区间,即可评判一个分析方法的准确程度。图1显示了两个群体历史模型的分析结果,可以看出FitCoal估计的群体历史不但是无偏的,而且其置信区间小于目前领域内常用的PSMC、Stairway Plot和SMC++三种方法。研究进一步通过大量的计算机模拟,分析不同条件下的群体历史,包括群体交融和自然选择。结果均表明FitCoal可以精准地估计百万年内的人类群体历史。

基于FitCoal,研究进一步分析了来自千人基因组计划和HGDP-CEPH基因组计划产生的、共50个现代人类群体的基因组数据,首次发现了在距今93.0万年前,人类祖先由于早、中更新世过渡期的气候剧烈变化,在短期内丧失了约98.7%的成员个体,几乎灭绝。在长达11.7万年的时间里平均成年个体数仅为1,280,并从千人基因组和HGDP-CEPH两组独立数据获得这一群体大小的估值几乎完全一致,分别为1,270和1,300。考虑到群体数量的自然波动,这一平均估值代表了远古群体瓶颈期间最小群体数量的上限。研究采用HGDP-CEPH数据集的两个南部非洲群体作了进一步验证。虽然样本量仅为6个和8个个体,但FitCoal依然检测到远古群体瓶颈。对非洲群体样本重抽样的研究成果表明,仅需3个非洲个体的基因组,FitCoal即可检测到这一远古群体瓶颈,进一步表明计算生物学创新成就了这一发现。

这一严重的远古群体瓶颈,恰好与非洲人类祖先化石的缺失环节、非洲直立人(Homo erectus)化石的消失、新的古人类物种(LCA)的形成、两条古人类2号染色体的融合阶段相对应(图2)。进一步,这说明早、中更新世过渡期严重的群体瓶颈对人类进化具有关键影响,可能决定了现代人类许多关键表型的形成。同时,这一远古时期群体数量的衰减,降低了65.85%现代人群的遗传多样性,对人类生命和健康产生了深远影响。

该研究由营养与健康所、华东师范大学主导,联合意大利罗马大学、意大利佛罗伦萨大学和美国德克萨斯大学等共同完成。研究工作得到国家自然科学基金、中国科学院战略性先导科技专项、国家重点研发计划、美国国立卫生研究院、山东省自然科学基金、中国博士后科学基金、营养与健康所、华东师范大学及济南市市校融合发展战略工程项目的支持。

论文链接

图1.?FitCoal、PSMC、Stairway Plot和SMC++估计的群体历史

图2.?人类祖先在早、中更新世过渡期经历的严重群体瓶颈(图片右侧对应非洲古人类化石缺失环节和不同的化石分类、2号染色体的融合时间,其中LCA指现代人类、尼安德特人和丹尼索瓦人的共同祖先)