基于表型相似性系统分析线粒体氨酰tRNA合成酶变异:罕见病队列研究新策略

《European Journal of Human Genetics》:A systematic analysis of mitochondrial aminoacyl tRNA synthetase variants in a rare disease cohort

【字体: 时间:2025年12月28日 来源:European Journal of Human Genetics 4.6

编辑推荐:

  【推荐语】本研究针对线粒体氨酰tRNA合成酶(mt-aaRSs)相关疾病表型异质性高、诊断困难的临床挑战,在RD-Connect罕见病队列中开发了一种系统量化个体表型相似性的新方法。研究人员通过整合基因组-表型分析平台(GPAP)数据和手动构建的表型-基因型参考数据集,成功在98例携带mt-aaRS基因变异的个体中鉴定出11例新诊断和13例意义未明变异(VUS),其中4例未被现有分析流程(Exomiser)识别。该研究为表型高度异质的罕见病诊断提供了可复制的分析框架,显著提升了变异解读的准确性。

  
在生命科学的微观宇宙中,线粒体作为细胞的"能量工厂",其功能异常会导致一系列罕见的遗传性疾病。其中,由核基因编码的线粒体氨酰tRNA合成酶(mitochondrial aminoacyl-tRNA synthetases, mt-aaRSs)缺陷引起的疾病尤为复杂多样。这些酶负责在线粒体蛋白质翻译过程中将特定氨基酸连接到对应的tRNA上,如同精密的分子"钥匙"开启蛋白质合成的"锁"。一旦这些"钥匙"出现故障,就会导致线粒体蛋白质合成障碍,进而引发能量代谢危机。
目前,全球已报道约300例mt-aaRS相关疾病患者,但随着高通量测序技术的普及,这类疾病的发现率正在迅速上升。然而,这些疾病的表现千变万化:有的患者在婴儿期即出现严重脑病、癫痫发作;有的则表现为听力丧失、卵巢功能早衰;还有些会累及多个器官系统,如HUPRA综合征(高尿酸血症、肺动脉高压、肾功能衰竭和碱中毒)就是由SARS2基因变异引起的典型例子。这种巨大的表型异质性使得临床诊断如同大海捞针,许多患者长期无法获得明确诊断。
更棘手的是,即使在同一mt-aaRS基因中,不同变异也可能导致完全不同的临床表现。例如,AARS2基因的c.1774C>T p.(Arg592Trp)变异与心肌病和脑病相关,而该基因的其他变异则可能导致白质脑病伴卵巢功能衰竭。这种复杂性使得传统的基因变异解读方法面临巨大挑战,迫切需要开发新的诊断策略。
面对这一难题,剑桥大学的研究团队在《European Journal of Human Genetics》上发表了一项创新研究。他们利用欧洲大型罕见病项目RD-Connect中的基因组-表型分析平台(Genome-Phenome Analysis Platform, GPAP),开发了一种系统性的分析方法,通过量化患者与已发表病例的表型相似性,来辅助mt-aaRS基因变异的临床解读。
研究团队采用了几项关键技术方法:首先,他们在包含10,935名个体的RD-Connect GPAP队列中,通过生物信息学筛选和手动分析,重点关注了10个mt-aaRS基因的变异;其次,通过PubMed文献回顾手动构建了包含234名已确诊患者的表型-基因型参考数据集,所有临床信息均映射为人类表型本体(Human Phenotype Ontology, HPO)术语;最后,利用ontologySimilarity R包中的Lin相似性算法计算表型相似性评分,并建立广义线性模型(GLM)和随机森林(RF)分类器来评估该评分对mt-aaRS疾病的预测价值。
总体GPAP队列中mt-aaRS变异的评估
研究人员在RD-Connect GPAP的10,935名个体中进行了系统性筛选。初步分析发现了145个变异涉及117名个体,分布在16个基因中。经过严格的质量控制和过滤,最终确定了38名个体携带63个变异,涉及10个mt-aaRS基因(AARS2、CARS2、DARS2、EARS2、IARS2、LARS2、NARS2、RARS2、VARS2、WARS2),这些个体构成了进一步分析的核心队列。
变异解读
变异解读结果显示,38名参与者中有11人携带可能致病(LP)或致病(P)变异。研究人员比较了初始ACMG(美国医学遗传学与基因组学学会)分类与Varsome、Franklin在线平台的分类结果,并引入了表型相似性评分作为PP4支持性标准(评分≥0.3为PP4支持,≥0.4为PP4中度),形成了修订的ACMG分类。值得注意的是,Exomiser使用ERN-RND(欧洲罕见神经系统疾病参考网络)基因列表对变异进行排序时,部分最终被确认为LP/P的变异并未被优先识别,表明传统分析流程存在局限性。
表型分析-文献回顾
通过系统的文献回顾,研究团队建立了包含234名患者的参考数据集,涵盖了10个mt-aaRS基因的详细表型-基因型信息。与从hpo.jax.org下载的HPO数据集相比,手动 curated 的参考数据集包含了更多具有鉴别意义的表型术语(957个 vs 336个非冗余HPO术语),为准确的表型相似性分析奠定了基础。
表型相似性分析
表型相似性分析显示,不同mt-aaRS基因相关的疾病表型异质性程度各异。DARS2相关疾病患者表现出较高的表型相似性,主要集中于神经系统特征;而IARS2相关疾病患者则表型更为多样,包括铁粒幼细胞性贫血、畸形特征、MRI和EEG异常等。这表明表型相似性分析能够捕捉到不同基因特有的临床模式。
表型相似性评分的预测价值
研究人员构建了包含1,754名个体(234名mt-aaRS患者和1,520名其他诊断患者)的数据集,评估表型相似性评分对mt-aaRS疾病的预测能力。随机森林(RF)模型表现优异,在测试集上准确率达到94.2%,AUC为0.976,明显优于广义线性模型(GLM)的85.5%准确率和0.932 AUC。表型相似性评分被确定为最重要的预测因子。通过Youden指数确定的最佳表型相似性评分阈值为0.363-0.365,研究中选择≥0.3作为支持性标准,≥0.4作为中度标准。
GPAP中未确诊个体携带mt-aaRS变异的调查
将表型相似性分析应用于38名携带mt-aaRS变异的未确诊个体后,研究团队成功升级了7个变异的分类(从VUS升级为LP/P),在11名个体中确立了可能诊断,诊断率达到11.2%。值得注意的是,24名需要进一步调查的个体中,有4人(17%)的变异未被Exomiser识别,凸显了该方法对现有诊断流程的补充价值。
这项研究的创新之处在于将个体层面的表型相似性量化系统性地整合到罕见病变异解读中。通过建立高质量的mt-aaRS特异性表型-基因型参考数据集,并开发可靠的预测模型,研究人员成功证明表型相似性评分是区分mt-aaRS相关疾病的有效工具。这种方法不仅提升了变异解读的准确性,还能识别出现有自动化流程可能忽略的重要变异。
研究的实际意义在于为临床遗传学家提供了实用的诊断工具。通过将表型相似性标准纳入ACMG框架,原本被归类为VUS的变异可能被重新分类为LP,从而使患者家庭能够获得更明确的遗传咨询,甚至考虑产前诊断或植入前遗传学测试等生殖选择。
然而,研究也存在一定局限性,如仅关注了10个最常见的mt-aaRS基因,而未包含所有19个相关基因。此外,部分VUS变异仍需家系共分离分析或功能实验来最终确认致病性。未来,随着自然语言处理技术的发展,自动化从文献中提取个体层面HPO数据的过程将进一步完善这类参考数据库的构建。
这项研究为高度异质的罕见病诊断提供了可复制的工作流程,强调了表型数据在基因组医学时代的重要性。通过将精密的生物信息学分析与临床专业知识相结合,我们正在逐步解开罕见遗传病诊断的复杂谜题,为患者带来新的希望。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号