
-
生物通官微
陪你抓住生命科技
跳动的脉搏
法医DNA混合样本中贡献者数量估计对似然比计算的差异性影响研究
【字体: 大 中 小 】 时间:2025年05月10日 来源:International Journal of Legal Medicine 2.2
编辑推荐:
本研究针对法医遗传学实践中复杂混合样本(含多贡献者)的鉴定难题,通过对比定性(LRmix Studio)与定量(EuroForMixTM、STRmixTM)基因分型工具,系统评估了贡献者数量(NoC)估计偏差对似然比(LR)计算结果的影响。研究发现,低估NoC会导致LR值显著降低,定量工具对NoC变化更敏感,强调了专家准确估计NoC在法医证据量化中的关键作用。
在法医DNA鉴定领域,犯罪现场常出现多人混合的生物样本,这类样本的解读如同解开一团纠缠的遗传密码锁。最大的挑战在于:贡献者数量(Number of Contributors, NoC)通常未知,而现有基因分型软件(如LRmix Studio、EuroForMixTM)却要求用户预先输入该参数。专家们常通过最大等位基因计数(MAC)等主观方法估算NoC,但低质量DNA样本中的等位基因共享、比例失衡、stutter峰(扩增假象)等问题,使得这种估计如同在迷雾中数脚印——极易出错。此前研究多采用已知NoC的模拟样本,但真实案件的复杂性能被完全复现吗?
为此,葡萄牙健康创新与研究机构(i3S)联合波尔图大学等团队,首次基于152组真实案件样本(含75组双贡献者、77组三贡献者混合DNA)开展研究。这些样本来自葡萄牙司法警察科学实验室,经过不可逆匿名化处理,涵盖21个常染色体短串联重复序列(STR)标记。研究人员通过"假设检验"框架,计算了参考样本作为混合样本贡献者的似然比(Likelihood Ratio, LR),并故意将NoC高估(+1)或低估(-1),比较LR值的变化幅度。
关键技术包括:1)使用定性工具LRmix Studio v2.1.3(基于最大似然估计MLE)和定量工具EuroForMix v3.4.0(伽马峰高模型)、STRmixTM v2.7(对数正态峰高模型+马尔可夫链蒙特卡洛MCMC算法);2)标准化参数设置(如采用NIST高加索人群等位基因频率);3)通过log10尺度比值(R)量化LR差异。
【结果与发现】
【结论与意义】
这项发表于《International Journal of Legal Medicine》的研究首次揭示:在真实法医样本中,NoC估计偏差会显著扭曲证据量化结果,且影响程度远超模拟实验的预期。尤其当低估NoC时,可能将真凶的LR值压缩数万倍,甚至导致"证据反转"。研究强调:(1)定量工具虽强大但更依赖准确NoC;(2)专家需结合峰高失衡、stutter比例等综合判断;(3)开发NoC自动估计算法将是未来关键。正如作者Camila Costa(通讯邮箱camilac@i3s.up.pt)指出:"概率基因分型软件是专家的助手而非替代者,任何参数设置都需批判性审视。"该成果为法医实践提供了重要警示——在DNA证据的数学外衣下,依然跳动着需要人类智慧裁决的初心。
生物通微信公众号
知名企业招聘