两种端到端的法医单细胞概率系统的显著性、合法性和可信度

《Forensic Science International: Genetics》:Salience, legitimacy, and credibility of two end-to-end forensic single cell probabilistic systems

【字体: 时间:2025年09月28日 来源:Forensic Science International: Genetics 3.2

编辑推荐:

  本文提出一种基于法医意识的单细胞聚类方法(FAC),通过模型优化和概率校准,有效解决了混合样本中多贡献者检测的难题。实验对比了传统模型聚类(MBC)与FAC的性能,发现FAC在聚类数量准确性、概率质量分布集中度及Brier分数校准方面均显著优于MBC,且能将贡献者数量估计误差降低至0。研究证实FAC可提升单细胞DNA数据库的检索效率,减少误判风险,为法医实际应用提供可靠工具。

  在现代的法医学领域,单细胞DNA分析作为一种新兴技术,为解决复杂的DNA混合样本提供了新的可能性。传统的DNA分析方法通常涉及从混合细胞样本中提取DNA,并通过电泳图谱(electropherogram)或序列数据来分析。然而,这种方法往往受到多种因素的限制,例如,当DNA混合样本包含多个贡献者时,无法准确区分各个贡献者的基因型,导致结果可能不准确,从而影响案件的调查和处理。这种限制使得法医学界一直在寻求更精确的分析方法,以克服混合样本分析中的困难。因此,单细胞DNA分析技术的出现为这一领域带来了新的希望,尤其是在无法确定嫌疑人的情况下,单细胞分析能够生成更多的调查线索。

单细胞DNA分析的关键在于其前端处理方式,即通过技术手段将每个细胞单独分离,然后对每个细胞进行DNA提取和PCR扩增。这种方式能够避免传统混合样本分析中由于DNA量不足或基因型混淆所导致的问题。在处理单细胞数据时,分析过程通常包括两个主要步骤:首先,通过某种聚类方法将来自不同细胞的DNA信号进行分组;其次,基于这些分组进行基因型预测,并评估其可靠性。在这个过程中,聚类算法的选择至关重要,因为它不仅影响对贡献者的数量判断,还关系到最终基因型预测的准确性。

本研究探讨了两种聚类方法:基于模型的聚类(MBC)和法医学感知聚类(FAC)。MBC是一种传统的聚类方法,它不依赖于预先设定的贡献者数量,而是通过模型选择和贝叶斯信息准则(BIC)来估计最可能的贡献者数量。然而,MBC在处理某些复杂混合样本时,可能会出现过聚类(over-clustering)的问题,即返回的聚类数量多于实际的贡献者数量,这可能影响调查效率。相比之下,FAC则是在MBC的基础上,进一步考虑了法医学的实际需求,例如基因型频率信息和信号峰高度模型,从而提高了聚类的准确性和预测的可靠性。通过这种方式,FAC不仅能够更精确地判断贡献者数量,还能更有效地进行基因型预测,使得结果更具法医学意义。

为了评估这两种聚类方法的性能,本研究构建了一个包含630个混合样本的测试集,每个样本包含不同数量的贡献者,且每个贡献者的DNA信号被精确记录。通过分析这些样本,研究人员计算了两种方法在基因型预测和贡献者数量估计方面的准确率,并使用了Brier Score(BS)这一严格合理的评分规则,将BS分解为校准(CAL)和细化(REF)两个部分。校准评估的是预测结果与真实结果之间的匹配程度,而细化则关注预测的分布是否集中于可能的基因型。结果表明,FAC在这些方面都优于MBC,尤其是在校准和细化指标上表现更佳。此外,FAC在贡献者数量估计上也表现出更高的准确性,对于所有测试的混合样本,FAC均返回了正确的聚类数量,而MBC则有14%的样本出现了过聚类的问题。

通过将FAC方法集成到EESCIt?系统中,研究人员创建了一个完整的单细胞概率分析框架,该框架不仅能够评估DNA混合样本的贡献者数量,还能确定每个贡献者的基因型,并据此进行更精确的调查。这种系统能够处理大量数据,同时确保预测结果的准确性和可靠性,从而为法医学界提供了一种更有效的工具。此外,通过将单细胞数据与法医学框架相结合,研究人员能够更全面地评估DNA混合样本的分析效果,并为未来的法医学实践提供理论支持和方法指导。

单细胞DNA分析的广泛应用还面临着一些挑战,例如数据处理的复杂性、对计算资源的需求以及对实验设计的高要求。然而,随着技术的进步和方法的优化,这些挑战正在逐步被克服。例如,通过使用高效的聚类算法和合理的评分规则,研究人员能够确保预测结果的准确性和可靠性,从而提高整个分析流程的效率。此外,单细胞数据的获取和处理也提供了更多的信息,使得法医学分析能够更深入地理解DNA混合样本的来源和组成。

总之,单细胞DNA分析作为一种新兴的法医学技术,为解决复杂的DNA混合样本提供了新的可能性。通过采用更先进的聚类方法,如FAC,研究人员能够更准确地判断贡献者数量和基因型,并确保预测结果的可靠性。这些成果不仅有助于提高法医学分析的准确性,还为未来的法医学研究和实践提供了重要的参考和指导。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号