MitoPhen v2数据库扩展助力原发性线粒体疾病基因型-表型关联的系统性解析

《Genetics in Medicine》:KLHL13 functional defects cause neurodevelopmental disorder in humans that can be rescued via inhibition of AURKB in cellular and animal models

【字体: 时间:2025年10月28日 来源:Genetics in Medicine 6.2

编辑推荐:

  本研究针对原发性线粒体疾病(PMD)表型复杂、基因型识别困难的问题,开展了基于MitoPhen v2数据库的大规模表型分析。研究人员通过手动注释HPO术语、主成分分析及表型相似性评分,成功构建了涵盖10,626个体的资源,揭示了PMD的六维表型特征,并识别出111个新的基因-表型关联。该研究为PMD的精准诊断和变异解读提供了强有力的数据支持和可转移的分析框架。

  
在遗传医学的复杂拼图中,原发性线粒体疾病(Primary Mitochondrial Diseases, PMD)一直是一块尤为棘手的部分。这类疾病源于线粒体DNA(mtDNA)或核基因的变异,临床表现千变万化,可累及全身几乎所有器官系统。对于临床医生和遗传学家而言,从这种巨大的表型异质性中识别出特定的致病基因型,犹如大海捞针,导致患者的“诊断之旅”漫长而曲折。传统的疾病描述方式难以系统捕捉和比较不同患者、不同基因型之间的表型差异,这极大地阻碍了精准诊断的进程。
为了破解这一难题,由Thiloka Ratnaike、Siddharth Ramanan等来自多家机构的研究人员组成的团队,在《Genetics in Medicine》上发表了他们的最新研究成果。他们此前开发的MitoPhen数据库已初具规模,而本研究则是对该资源的一次重大扩展和深度挖掘。研究团队旨在通过构建一个更全面、更系统化的基因型-表型关联数据库,为PMD的临床识别和基因诊断提供强大的数据基石和创新的分析工具。
研究人员开展此项研究主要依赖于几个关键技术方法。首先,他们进行了大规模的数据手动 curation(人工审阅和标注),从1,597篇出版物中提取了10,626名个体的详细临床信息,并使用人类表型本体(Human Phenotype Ontology, HPO)术语对表型进行标准化描述,构建了MitoPhen v2数据库。其次,他们运用主成分分析(Principal-Component Analysis, PCA)这一多元统计方法,来降维和可视化高维度的表型数据,从而提取出能够概括PMD系统级异常的关键表型维度。最后,研究团队计算了表型相似性评分,这是一种量化个体间表型相似程度的方法,用于评估其区分不同基因型的能力。样本队列来源于已发表的医学文献,涵盖了包括mtDNA突变、核DNA突变以及单一大规模mtDNA缺失(Single Large-Scale mtDNA Deletion, SLSD)在内的多种PMD基因型。
结果
Methods
本研究的核心方法是构建MitoPhen v2数据库。通过对大量文献进行人工审阅和标注,研究人员系统性地收集了10,626名个体的临床数据,并使用HPO术语对其表型进行标准化。在此基础上,他们采用PCA分析来揭示PMD表型的宏观结构,并利用HPO术语富集分析和表型相似性评分来鉴别和区分常见的PMD基因型。
Results
分析结果显示,MitoPhen v2数据库规模显著扩大,新增了3,940名个体,总共涵盖了117种不同的基因型。在7,586名受累个体中,共记录了72,861个HPO术语,构成了一个极其丰富的表型数据集。PCA分析成功识别出六个关键的表型维度,这些维度共同解释了PMD中大部分的系统级表型差异。在更精细的HPO水平上,研究人员观察到了基因特异性的表型富集模式,并新发现了111个未被当前HPO数据库收录的基因-表型关联链接,这对于完善知识库具有重要意义。以常见的MT-TL1、SLSD和POLG基因型为例,基于表型相似性评分的分析模型能够可靠地将携带这些基因型的个体与其他个体区分开来,证明了该方法在辅助基因诊断方面的潜在应用价值。
Conclusion
研究的结论部分强调,MitoPhen v2数据库实现了对异质性显著的PMD表型进行系统化、基因型导向的分析。这项工作凸显了结构化、个体水平临床数据在诊断中的巨大价值。从这类大型数据集中衍生出的表型相似性度量指标,能够优化大型罕见病队列中的基因变异解读,为其他表型复杂的遗传性疾病研究提供了一个可迁移的分析框架。
总结与讨论
本研究的意义深远。它不仅提供了一个宝贵的PMD临床数据资源,更重要的是展示了一种应对复杂遗传病表型分析的有效策略。通过将非结构化的临床描述转化为结构化的HPO数据,并运用先进的生物信息学方法进行分析,研究者成功地将纷繁复杂的临床表现“翻译”成了可计算、可比较的量化指标。这为克服PMD诊断中的表型异质性挑战提供了新思路。所开发的表型相似性评分方法,未来或可整合到临床决策支持系统中,当遇到一个具有复杂表型的未确诊患者时,系统可以将其表型谱与数据库中已知基因型的表型谱进行匹配,从而为优先考虑哪些基因进行检测提供线索,缩短诊断时间。此外,新发现的111个基因-表型关联也为理解特定基因的生物学功能及其在疾病中的作用提供了新的线索。总之,这项研究标志着向PMD的精准医学迈出了坚实的一步,其方法论对整个遗传病领域都具有重要的借鉴意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号