解锁古 DNA 的免疫密码:低覆盖度测序下 HLA 分型揭示欧洲免疫进化奥秘

【字体: 时间:2025年02月21日 来源:Scientific Reports 3.8

编辑推荐:

  为探究计算 HLA 分型方法能否用于无目标富集的 aDNA 分析,研究人员评估相关工具性能并研究欧洲 HLA 进化。结果显示 OptiType 表现出色,且发现史前至现代欧洲人群 HLA 等位基因频率变化。推荐科研读者阅读,以了解古 DNA 免疫遗传研究新进展。

  
在现代生物学研究领域,人类白细胞抗原(HLA)系统的研究一直备受瞩目。HLA 系统在免疫反应中起着关键作用,与多种疾病的发生、发展密切相关。随着下一代测序技术的兴起,它为研究 HLA 系统的遗传学提供了更广阔的空间,让科学家们能够突破传统 PCR 技术的局限,如劳动强度大、难以规模化、分型分辨率低等问题。同时,计算 HLA 分型策略也借助公共数据库中大量的 HLA 测序数据得以发展,通过将高通量测序读数与已知等位基因进行比对,再由概率模型预测最可能的等位基因对。

一些研究已经利用这些技术成果,对数百名现代个体的 HLA 区域进行特征分析,建立了参考面板,揭示了特定人群的免疫原性变异。还有研究发现了特定 HLA 等位基因与感染性疾病、自身免疫和炎症性疾病等临床相关表型之间的关联。不仅如此,DNA 提取技术和测序方法的进步,使得对古代个体遗传物质(aDNA)的全面研究成为可能。通过对古代个体 HLA 系统的研究,科学家们可以深入了解不同历史时期、不同地域人群的免疫遗传特征,以及宿主与病原体之间的相互作用。比如,有研究对古代非洲个体基因组进行 HLA 分型,支持了他们的撒哈拉以南非洲起源说,并对与病毒感染反应相关的 HLA 等位基因进行了特征分析;还有研究从古代麻风病和鼠疫受害者的基因组中,检测到了与疾病易感性相关的遗传特征。

然而,目前仍存在一个重要问题亟待解决。现有的计算 HLA 分型方法大多是基于目标富集测序数据进行研究的,而对于全基因组测序(WGS)产生的未经过 HLA 目标富集的数据,尤其是 aDNA 数据,这些方法是否适用还不清楚。毕竟,大多数鸟枪法测序的古代基因组平均读数深度极低(≤1×),在这样低的读数深度下进行 HLA 分型,其准确性和可靠性面临巨大挑战。但值得注意的是,也有相当数量的样本达到了更高的覆盖深度,如果能够有效利用这些数据,将为研究人类免疫遗传进化提供宝贵的资源。例如,在人类迁徙、传染病流行以及人群混合等重要历史事件中,这些数据可能蕴含着关键信息,有助于揭示它们对人类免疫遗传组成的影响。

为了攻克这一难题,相关研究人员在《Scientific Reports》期刊上发表了题为《Feasibility of HLA typing on shotgun ancient DNA data and its application to investigate HLA evolution in Europe》的论文。研究人员通过一系列实验,评估了五种 HLA 分型工具在低覆盖度 WGS aDNA 数据上的性能,得出了重要结论:OptiType 是在不同读数深度下进行计算 HLA I 类分型最有用的工具,在低至 2x 的读数深度下,I 类基因的一级分辨率分型仍具有可行性,准确率可达≈80%;通过对欧洲史前人群的研究,发现 HLA 等位基因频率在新石器时代农民和现代人群之间发生了显著变化,这些变化与感染性和自身免疫性疾病相关,这表明利用鸟枪法 aDNA 数据进行 HLA 分型,研究该基因座在重要历史转变时期的进化是可行的。这一研究成果意义重大,它为利用大量未被充分利用的古代基因组数据研究人类免疫遗传进化开辟了新途径,有助于我们更深入地理解人类免疫系统的演变以及与疾病的关系,为未来的医学研究和疾病防治提供了重要的理论依据。

在这项研究中,研究人员用到了多个关键技术方法。首先是数据获取与处理技术,他们从 1000 Genomes Project(1KGP)数据库下载了具有实验 HLA 分型信息的个体全基因组测序数据,并获取了 56 个高覆盖度 aDNA 基因组数据,对这些数据进行预处理和读数深度调整。其次是模拟技术,利用 gargammel 程序模拟 aDNA 的片段化和脱氨模式,生成具有 aDNA 特征的数据集。最后是计算 HLA 分型技术,采用 HLA-HD、HLAScan、HLA-LA、OptiType 和 Bowtie2 MA 等公开可用的计算方法,对不同数据集进行 HLA 分型,并评估其准确性和一致性。

下面我们来详细看看研究结果。

  • HLA 分型性能评估 —— 在现代 WGS 数据上的表现:研究人员评估了五种计算 HLA 分型策略在 176 个 1KGP 个体上的准确性。这些个体具有经典 I 类和 II 类基因的实验 HLA 分型信息,研究人员在不同读数深度(10x - 1x)下对这些个体进行等位基因调用。结果发现,所有方法的性能都随着读数深度的降低而下降。在所有深度下,OptiType 在 I 类基因分型中始终具有最高的准确性,而 HLAScan 在 I 类和 II 类基因分型中得分最低。在 10x 读数深度时,OptiType 在一级和二级分辨率下的平均准确率均为 0.97,表现最佳;HLA-LA 在一级分辨率下平均准确率为 0.97,二级分辨率下为 0.88,位居第二。由于 II 类基因分型整体表现不佳,研究人员在后续分析中舍弃了这些基因。此外,研究还发现,1KGP 筛选样本的人口统计学起源对工具性能没有显著影响,但 HLA-B 基因的分型准确性明显低于 HLA-A 和 HLA-C 基因。
  • HLA 分型性能评估 —— 在模拟 aDNA 上的表现:为了评估这些工具在 aDNA 测序数据上的性能,研究人员使用 gargammel 模拟 aDNA 的片段化和脱氨模式,并将这些 aDNA 特征整合到 1KGP 样本中,生成 1KGP-aDNA 数据集。通过比较有无模拟 aDNA 特征的 WGS 数据的 HLA 分型,发现 OptiType 在一级和二级分型分辨率下的平均准确率差异分别约为 0.07 和 0.14。在模拟 aDNA 数据的评估中,OptiType 在所有用于 I 类基因分型的方法中表现最佳,在中等(5x)和低(2x)读数深度下都能产生准确的结果,尤其是在 HLA-C 基因的一级分辨率分型中,平均准确率分别达到 0.86 和 0.75。相比之下,五种方法中有三种无法对人工生成的 aDNA 数据进行预测,而 Bowtie2 MA 管道在所有测试读数深度下的准确率均低于 OptiType。
  • HLA 分型性能评估 —— 在高覆盖度古代基因组上的表现:研究人员进一步评估了这些 HLA 分型策略在 56 个高覆盖度(>10x)aDNA 基因组上的性能。他们将这些基因组下采样到 10 个不同的读数深度(10 - 1x),并将每个深度下的分型结果与高覆盖度下的分型结果进行比较。结果与模拟 aDNA 数据的评估一致,样本的一致性与读数深度之间存在明显关联,OptiType 在实际 aDNA 数据的 HLA 分型中始终获得最佳结果。即使在低至 2x 的读数深度下,OptiType 在一级分辨率下仍能保持较高的一致性,HLA-A、HLA-B 和 HLA-C 基因的平均一致性值分别为 0.77、0.68 和 0.89。而 Bowtie2 MA 管道与 OptiType 相比,一致性结果较差。
  • HLA 等位基因频率变化追溯 —— 新石器时代农民的影响:研究人员利用平均读数深度≥2x 的史前欧洲古代基因组,研究经典 HLA I 类等位基因频率在不同史前人群中的演变。他们创建了一个包含 154 个史前欧洲个体的数据集,并根据文献将其分为欧洲狩猎采集者(HG)、新石器时代农民(NF)和青铜时代(BA)人群。使用 OptiType 对 I 类基因进行 HLA 分型,并估计每个史前人群和现代欧洲人群(基于 1KGP 中欧洲血统个体和 Allele Frequencies Database 中的数据)的等位基因频率。分析发现,在史前和现代欧洲人群中,有六个一级分辨率(HLA-A:1,HLA-B:3,HLA-C:2)和两个二级分辨率(HLA-A:1,HLA-B:1)的等位基因频率发生了变化,且这些变化超出了由约 50k 个全基因组 SNP 频率变化组成的背景分布的 95% 置信区间。这些变化大多在对比 NF 和现代欧洲人群的频率时观察到,其中一些等位基因与感染性病原体和自身免疫性疾病的易感性或抗性有关。尽管在多重检验校正后,只有 HLA-C*07 等位基因的频率变化具有统计学意义,但其他等位基因的变化趋势仍具有研究价值。
  • 免疫相关 SNP 频率变化分析 —— 时间中的不同模式:由于 HLA 基因在免疫中的关键作用,研究人员对比了 HLA 基因座与其他参与免疫过程的 SNP 的频率变化,以进一步描述欧洲人免疫景观随时间的变化。他们使用全基因组 SNP 频率变化的分布来测试随时间发生显著频率变化的变异。结果发现,共有 37 个 SNP 显示出显著的频率变化,频率变化幅度从 19% 到 52% 不等,这些变化大多出现在对比史前欧洲狩猎采集者和新石器时代农民与现代欧洲人群的频率时。

综合研究结果和讨论部分来看,这项研究意义非凡。研究表明,OptiType 在不同读数深度下对 aDNA 数据进行 I 类 HLA 分型具有较高的可靠性,但现有工具在处理 aDNA 数据时仍存在一些不足,如未考虑 aDNA 的特定特征、使用过时的 HLA 等位基因参考或未考虑 HLA 区域的内含子区域等。尽管如此,利用 OptiType 对 I 类基因进行分型的结果展示了适应 aDNA 分析困难的可行性。研究还发现,HLA 等位基因频率在新石器时代农民和现代人群之间的变化最大,这些变化可能反映了人类免疫基因受到的选择压力,与感染性和自身免疫性疾病相关。虽然研究中大部分信号在多重检验校正后未达到统计学显著水平,但通过对频率变化较大的等位基因的研究,仍能发现一些有趣的现象,如某些在古代较为常见的等位基因与现代疾病的关联。此外,研究免疫相关 SNP 的变化,为了解古代欧洲的免疫景观提供了更全面的视角。这项研究为利用低覆盖度 aDNA 数据研究人类免疫遗传进化奠定了基础,未来有望通过更大规模的研究,进一步揭示人类免疫系统在历史长河中的演变奥秘,以及这些演变对现代人类健康的影响。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号