
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多维度基因组联合分析助力超罕见单基因疾病的精准诊断
【字体: 大 中 小 】 时间:2025年08月08日 来源:Nature Communications 15.7
编辑推荐:
本研究针对罕见单基因疾病诊断难题,由Undiagnosed Diseases Network(UDN)团队开发了RaMeDiES统计框架,通过全基因组测序数据联合分析,整合de novo突变和复合杂合变异检测方法,在4,236例患者中发现5个新诊断和3个潜在致病基因。研究建立的自动化分析流程和公开数据库(https://dbmi-bgm.github.io/udn-browser/)为国际罕见病研究提供了新范式,显著提升了诊断率。
在医学遗传学领域,罕见单基因疾病犹如一座座孤岛,每年仍有大量患者深陷"诊断奥德赛"的困境。尽管基因组测序技术突飞猛进,但对于临床表现异质性高、病例稀少的疾病,传统个案分析方法往往力不从心。Undiagnosed Diseases Network(UDN)作为美国国家级研究网络,汇聚了哈佛医学院、斯坦福大学等12个临床研究中心的力量,专门攻克这些"医学谜题"。
面对这一挑战,哈佛医学院生物医学信息学系的Shilpa Nadimpalli Kobren和Mikhail A. Moldovan领衔的研究团队在《Nature Communications》发表重要成果。研究人员开发了创新性的RaMeDiES(罕见孟德尔疾病富集统计)分析框架,首次对UDN队列4,236例全基因组测序数据开展联合分析。通过建立精准的突变率模型和变异致病性预测体系,该研究不仅验证了已知诊断,还发现了8个新的基因-疾病关联,为罕见病诊断开辟了新途径。
研究采用三大关键技术:1)基于Roulette单碱基分辨率突变率模型的全基因组变异分析;2)开发RaMeDiES-DN和RaMeDiES-CH算法分别检测de novo突变和复合杂合变异;3)建立标准化的临床评估协议对候选基因进行表型匹配验证。研究队列包含886例散发或疑似隐性遗传病例,所有患者均经过严格表型标准化记录和家系验证。
研究团队首先在1,072例完整 trio测序数据中检测de novo变异,平均每个基因组发现78.3个点突变和9.5个indel。通过创新的Irwin-Hall分布统计模型,研究人员发现KIF1A基因在错义变异富集分析中达到Bonferroni校正显著性水平。引人注目的是,两个携带LRRC7基因leucine-rich重复区错义变异的患者均表现出肌张力低下和发育迟缓的神经表型,这一发现已被纳入最新临床病例系列研究。

研究突破性地将SpliceAI预测的远端剪接变异纳入统计框架。通过大规模平行剪接报告实验(MPSA)验证,发现高SpliceAI评分变异(>0.5)与体外实验结果显著相关。虽然队列中未发现显著富集的剪接相关基因,但该方法为全基因组数据中非编码变异的解读提供了新思路。
针对非近亲婚配家系,研究开发的RaMeDiES-CH算法通过条件概率模型规避了群体结构干扰。在排名前13的候选基因中,不仅重现了5个已知诊断,还发现MED11基因内含子变异导致的首个内含子异常保留,通过RNA测序在患者血液样本中验证了这一发现。

研究人员将2,662例患者按表型相似性聚类后开展通路分析。在一个19例免疫异常患者亚群中,发现免疫蛋白酶体复合体通路(KEGG:03050)显著富集。其中POMP基因的移码变异患者与PSMB8基因错义变异患者表现出相似的联合免疫缺陷特征,提示该通路异常可能导致独特的免疫失调综合征。

这项研究标志着罕见病遗传分析从个案研究向数据科学范式的转变。RaMeDiES框架的创新性在于:1)实现不同变异类型的统一建模;2)开发可共享的中间统计量,打破数据孤岛;3)建立临床验证标准化流程。研究发布的公开数据库和开源软件包,为国际罕见病研究的协同创新提供了基础设施。随着测序技术的普及和队列规模的扩大,这种联合分析方法有望最终揭示所有单碱基变异导致的孟德尔疾病遗传基础,为精准医学时代罕见病诊断树立新标杆。
生物通微信公众号
知名企业招聘