
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于隐马尔可夫模型的21三体染色体不分离错误阶段与交叉事件推断及其在唐氏综合征研究中的应用
【字体: 大 中 小 】 时间:2025年07月10日 来源:Nature Communications 14.7
编辑推荐:
本研究开发了MeiHMM方法,通过唐氏综合征(DS)患者基因组数据推断染色体21不分离(NDJ)错误阶段和交叉事件,无需亲本数据即可实现96.1%的准确率。研究人员分析了509例DS相关儿童白血病(DS-ALL)病例,发现NDJ错误类型与疾病发病年龄、基因组异常和预后显著相关,为先天性非整倍体疾病的病因学研究提供了新工具。
人类生殖过程中染色体分离错误会导致严重的遗传后果,其中21号染色体不分离(NDJ)引发的唐氏综合征(DS)是最常见的出生缺陷之一。虽然90%以上的DS病例源于母源减数分裂错误,但传统方法需要患者-父母三方数据才能确定NDJ发生阶段,这极大限制了大规模研究的开展。更棘手的是,NDJ错误类型与交叉事件的位置可能影响DS相关并发症的发生发展,如DS患者特有的急性淋巴细胞白血病(DS-ALL)风险增加现象,其内在机制尚不明确。
圣犹达儿童研究医院(St. Jude Children's Research Hospital)的研究团队在《Nature Communications》发表的研究中,开发了名为MeiHMM的创新方法。该方法仅需患者基因组数据,通过隐马尔可夫模型分析21号染色体上的三碱基基因型和单倍型配置,就能准确推断NDJ错误阶段(减数分裂I期[MI]、减数分裂II期[MII]或有丝分裂错误)和交叉事件位置。研究团队首先利用152例DS患者的三方数据验证了MeiHMM的准确性,随后将其应用于764例DS患者和509例DS-ALL患者的全基因组测序(WGS)数据,揭示了NDJ错误类型与疾病特征的关联。
关键技术包括:1)基于gnomAD和1000 Genomes数据库的群体等位基因频率分析;2)区分两类信息性SNP(罕见二等位基因型和罕见假设单倍型);3)隐马尔可夫模型对21号染色体进行单倍型区块划分;4)来自Gabriella Miller Kids First儿科研究计划的WGS数据队列分析。
【MeiHMM实现变异和单倍型分析识别NDJ时间和交叉位置】
研究设计了两类信息性SNP标记:类型1通过罕见二等位基因型(Alt:Alt:Ref)识别二单倍型状态;类型2通过相邻SNP构建假设单倍型,计算观察/预期(O/E)频率比识别三单倍型状态。模拟显示,99.7%的罕见二等位基因型和98.2%的低O/E比单倍型能正确指示单倍型状态。

【与三方分析的比较】
在152例DS患者中,MeiHMM对NDJ错误分类准确率达96.1%,交叉事件识别灵敏度91.6%。17%的MII错误被误判为MI,主要由于近着丝粒区的小交叉事件难以检测。扩大队列分析显示,764例DS患者中75%为MI错误(47%无交叉,28%有交叉),21%为MII错误,4%为有丝分裂错误,与微卫星标记研究结果一致。

【NDJ错误与DS-ALL疾病表型的关联】
在509例DS-ALL患者中,NDJ错误分布与普通DS人群相似,但存在显著异质性:MII/有丝分裂错误在10岁以上患者中占比更高(38% vs 24%);特定分子亚型(如ETV6::RUNX1-like和CRLF2 BCR::ABL1-like)中MII错误富集。生存分析显示,MII错误患者的无事件生存(EFS)和总生存(OS)更差,且二单倍型区块比例与不良预后独立相关。

这项研究的意义在于:1)MeiHMM突破了传统三方数据分析的限制,使大规模NDJ研究成为可能;2)首次揭示了NDJ错误阶段与DS-ALL临床特征的关联,为精准预后评估提供新指标;3)二单倍型状态(MII错误特征)与不良预后的关联,支持"有害等位基因剂量效应"假说。该方法可扩展至其他三体综合征(如13和18三体)研究,为先天性染色体异常的机制解析和临床管理开辟新途径。研究也存在局限性,如近着丝粒区小交叉事件的识别挑战,以及无法确定三体的亲本来源。未来研究可结合单细胞测序等技术进一步优化模型精度。
生物通微信公众号
知名企业招聘