
-
生物通官微
陪你抓住生命科技
跳动的脉搏
动态选择SNP的似然比框架在近亲缘关系推断中的应用与法医遗传谱系学创新
【字体: 大 中 小 】 时间:2025年07月24日 来源:Frontiers in Genetics 2.8
编辑推荐:
这篇综述创新性地提出KinSNP-LR算法,通过动态筛选高次要等位基因频率(MAF>0.4)和最小遗传距离(MGD>30cM)的单核苷酸多态性(SNP),将似然比(LR)计算融入法医遗传谱系学(FGG)工作流。研究基于gnomAD v4的222,366个SNP和千人基因组数据验证显示,126个SNP即可实现96.8%的二代以内亲缘关系判定准确率(F1=0.975),为法医实验室提供了符合传统STR鉴定标准的SNP分析新范式。
Introduction
法医遗传谱系学(FGG)正通过全基因组测序(WGS)技术革新人类身份识别领域。与传统短串联重复序列(STR)分析不同,FGG利用全基因组单核苷酸多态性(SNP)数据进行亲缘关系推断。然而,法医实践需要符合似然比(LR)标准的分析方法。本研究开发的KinSNP-LR系统通过动态选择非连锁、高信息量SNP(MAF>0.4,MGD>30cM),成功将WGS数据与传统亲缘鉴定框架对接。
Materials and methods/implementation
研究采用gnomAD v4的222,366个SNP构成基础面板,结合千人基因组计划的3,202个样本进行验证。独创的"贪心算法"从染色体端粒开始扫描,依次选择符合MAF阈值且间隔≥30cM的SNP。LR计算基于Thompson(1975)和Ge(2010-2011)的方法,引入10-3突变率模型应对分型错误。通过Ped-sim软件模拟包含50个家系的二代亲缘数据,设置0.001-0.05分型错误率评估系统稳健性。
Results
实证数据显示,MAF=0.4时筛选出的126个SNP对1,200对亲子、12对全同胞和32对二代亲缘的判定准确率达96.8%。模拟实验中,130个SNP在MAF=0.4条件下的加权F1值为0.928。特别发现当最大似然比超过次大值100倍时,可高置信度判定亲子/全同胞关系;而二代亲缘需达到1,000倍阈值。分型错误率超过0.01时,准确率显著下降至0.9198,凸显数据质控的重要性。
Discussion and conclusion
该研究突破性地实现三大创新:1)动态SNP选择替代固定面板;2)首次将WGS数据纳入LR计算框架;3)建立突变模型应对测序错误。相比Mostad(2023)的隐马尔可夫模型,本方法更适用于近亲鉴定,且能兼容低覆盖WGS数据(0.5-5X)。未来可通过引入Fst校正和Elston-Stewart算法扩展至复杂家系分析。目前系统已实现医学检验机构最关注的二代以内亲缘判定,为降解DNA样本的身份确认提供STR替代方案。
研究证实,即使仅采用346个SNP(MAF=0.4,MGD=10cM),二代亲缘判定准确率即可接近100%。这种"少而精"的策略既满足法医认证要求,又适应 forensic-grade WGS数据的特性,标志着法医遗传学正式进入基因组时代。
生物通微信公众号
知名企业招聘