构建连续模型:精准解读法医 DNA 混合样本微单倍型图谱的关键突破

【字体: 时间:2025年05月12日 来源:Forensic Science International: Genetics 3.2

编辑推荐:

  在法医 DNA 分析中,微单倍型(MHs)应用广泛,但 DNA 混合物分析存在难题。研究人员开发了用于解释 MH 标记混合基因型数据的连续模型。结果显示该模型对 2 - 3 人 DNA 混合物解读准确性高,为法医 DNA 分析提供新工具。

  在法医领域,精准的 DNA 分析是破解案件谜团的关键 “钥匙”。随着科技的进步,下一代测序(Next - Generation Sequencing,NGS)技术,也就是大规模平行测序(Massively Parallel Sequencing,MPS)闪亮登场。它就像一个强大的 “显微镜”,能够从法医 DNA 样本中挖掘出更多有价值的信息,让过去难以区分的细微差异无所遁形。然而,这项技术也带来了新的挑战。
MPS 技术虽然强大,但它的实验流程更为复杂,得到的图谱特征和传统基于毛细管电泳(capillary electrophoresis,CE)平台的图谱大不相同。MPS 图谱不仅能呈现序列的碱基组成,还能给出代表信号强度的读数(read counts,即读取深度)。可问题在于,不同位点的检测效率差异很大,而且图谱中还存在恼人的噪声。这些噪声就像图谱中的 “捣乱分子”,大多是相对于亲本等位基因序列的单碱基错误,读数变化多端,高读数的噪声很容易和真正的等位基因混淆,给基因型的解读带来极大困难。

在微单倍型(microhaplotype,MH)遗传标记方面,虽然它有着独特优势,比如扩增时没有恼人的 stutter(一种在 STR 分析中常见的干扰因素,MH 不存在该问题),但目前还没有针对 MPS - MH 图谱的完全连续模型。为了填补这一空白,推动法医 DNA 分析技术的发展,研究人员踏上了探索之旅。

此次研究中,研究人员构建了一个完全连续的模型 —— 截断高斯(Truncated Gaussian,TG)模型。该研究得到了中国国家自然科学基金(82230064)和中国国家重点研发计划(JG2021247)的支持 。研究成果发表在《Forensic Science International: Genetics》上。

研究人员采用了多种关键技术方法。首先,对实验室构建的两个 MH 面板(Panel A 包含 15 个 MH 标记,Panel B 包含 22 个 MH 标记)进行分析。利用 NGS 技术获取数据,通过对不同 DNA 输入量下的样本进行检测,观察等位基因和非等位基因序列的行为,从而构建并验证模型。同时,使用似然比(Likelihood Ratio,LR)计算等方法评估模型性能。

研究结果


  1. MH 多重检测系统:对 Panel A 和 Panel B 进行分析,在西南汉族人群中,Panel A 的有效等位基因数(effective allele count,Ae)均值为 4.12,鉴别力(discrimination power,DP)均值为 0.75,观察杂合度(observed heterozygosity,Ho)均值为 0.774;Panel B 的 Ae 均值为 4.22,DP 和 Ho 等指标也有相应数据,这些数据为后续研究提供了基础。
  2. MPS - MH 图谱特征:在敏感性实验中发现,DNA 输入量(15.625 pg 至 5 ng)与每个位点的平均读数之间呈非线性关系。这一发现为理解 MPS - MH 图谱的行为提供了重要依据。
  3. 模型性能评估:用 90 个由 9 个无关个体生成的不同混合比例的 DNA 混合物对模型进行测试。计算真实贡献者和非贡献者的 LR 值,并进行混合物反卷积。结果显示,该模型对 2 - 3 人 DNA 混合物的 MH 图谱解读准确性和特异性高。在 200 次 LR 计算中,真实贡献者的 LR 值大于 1 的情况出现了 190 次。在 26700 次模拟非贡献者测试中,2 人混合物中 LR 大于 1 的非贡献者比例为 0.0051%,3 人混合物中该比例为 4.68%。排除混合物中的平衡个体后,主要贡献者的平均反卷积准确率为 0.9145,其中 60.98%(100/164)的准确率达到 1。
  4. 影响因素分析:研究还发现,随着混合物比例增加或贡献者增多,区分等位基因和非等位基因变得愈发困难,噪声是影响基因分型准确性的关键因素。

研究结论与讨论


研究人员成功开发了适合 MPS - MH 图谱特点的完全连续模型。通过模型校准确定了先验参数,并利用混合 DNA 样本验证了模型性能。该模型在法医 DNA 混合物分析中展现出良好的应用前景,能够准确解读 MPS - MH 图谱,为个体识别、亲缘关系分析和祖先推断等法医应用提供有力支持。

噪声在 MPS - MH 图谱基因分型准确性方面起着关键影响,随着混合物复杂性增加,其影响更为显著。这提示后续研究需要进一步探索如何更好地处理噪声问题,优化模型性能。与 EuroForMix 等其他方法的比较,以及 Turing 期望测试结果等,也为模型的改进和应用提供了方向。该研究成果填补了法医 DNA 分析在 MPS - MH 图谱连续模型方面的空白,推动了法医 DNA 分析技术的进步,为司法实践提供了更精准、可靠的技术手段。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号