根据GnomAD数据库中ENG和ACVRL1基因预测致病变异体的等位基因频率计算出的遗传性出血性毛细血管扩张症的患病率估计值
《Circulation: Genomic and Precision Medicine》:Hereditary Hemorrhagic Telangiectasia Prevalence Estimates Calculated From GnomAD Allele Frequencies of Predicted Pathogenic Variants in ENG and ACVRL1
【字体:
大
中
小
】
时间:2025年09月19日
来源:Circulation: Genomic and Precision Medicine 5.5
编辑推荐:
遗传性血管性鼻咽肉芽肿(HHT)的发病率估算:通过基因数据库分析、阈值过滤和机器学习模型(HHT-MVP)三种方法,结合ACVRL1和ENG基因的致病性变异数据,发现HHT患病率在2.1-11.9/5000之间,较现有1/5000的估计值高2-12倍,提示该疾病可能被显著低估且接近罕见病阈值。
遗传性毛细血管扩张症(Hereditary Hemorrhagic Telangiectasia, HHT)是一种遗传性血管疾病,其特征是出现动静脉畸形(Arteriovenous Malformations, AVMs),这些畸形是动脉和静脉之间的直接连接。HHT通常以鼻出血、贫血和血管异常为主要临床表现,且具有近完全的外显率和显性遗传模式。HHT的发病率估计约为每5000人中1人,因此被归类为罕见疾病。然而,研究表明,HHT可能被低估,实际患病人数可能远高于临床确诊的病例。本文探讨了利用基因组数据估算HHT真实发病率的方法,并发现该疾病的发病率可能高于当前公认的水平。
HHT的病因主要与**ACVRL1**和**ENG**基因的杂合性功能丧失突变有关,这两个基因编码的蛋白质在骨形态发生蛋白(BMP)信号通路中起关键作用。BMP信号通路对于胚胎血管发育至关重要,其异常可能导致动静脉畸形的发生。尽管HHT的遗传机制已基本明确,但其临床诊断面临诸多挑战。这些挑战包括:疾病表现的异质性、诊断标准的局限性、症状的普遍性以及医学教育中对HHT的重视不足。例如,鼻出血虽然是HHT最常见症状之一,但这种症状在普通人群中也较为常见,因此医生可能不会立即怀疑HHT。此外,部分患者可能仅表现出肺部动静脉畸形,而没有其他典型症状,这进一步增加了诊断的难度。
为了更准确地估算HHT的发病率,本文采用了三种不同的方法:**保守性注释方法**、**阈值过滤方法**和**基于机器学习的分类方法**。第一种方法主要依赖于已知的临床注释数据,如ClinVar中标记为“致病性”或“很可能致病性”的突变,以及通过计算工具(如SpliceAI和CADD)筛选出的高概率致病性变异。这种方法较为保守,仅包括那些有明确致病性注释的变异,从而得到了HHT的发病率约为每5000人中有2.1人。第二种方法则使用了多种计算工具的阈值过滤,包括CADD、SpliceAI、AlphaMissense和REVEL等,以更广泛地涵盖可能的致病性变异。这种方法得到了更高的发病率,即每5000人中有4.4人。第三种方法结合了机器学习模型HHT-MVP(Hereditary Hemorrhagic Telangiectasia-Missense Variant Predictor)与阈值过滤,从而进一步提高了对错义突变的致病性预测准确性,最终得出的HHT发病率约为每5000人中有11.9人。
通过比较这三种方法的结果,可以发现HHT的发病率可能比当前公认的数据高2到12倍。这表明,HHT可能并不像人们认为的那样罕见,而是一种被严重低估的疾病。尤其是第三种方法,由于引入了机器学习模型,显著提高了对错义突变的分类准确性,从而能够更全面地识别潜在的致病性变异。此外,该研究还发现,HHT的致病性变异在不同种族群体中具有相似的分布频率,这表明HHT的发病率可能在不同人群中没有显著差异。然而,由于数据样本主要来自欧洲人群,对于非欧洲群体的研究仍需进一步补充。
研究中还评估了多种计算工具在预测HHT相关错义突变致病性方面的性能。结果显示,AlphaMissense、VEST4和metaRNN等工具在准确性和敏感性方面表现优异,而CADD虽然具有较高的敏感性,但特异性较低,容易将一些非致病性突变误判为致病性。因此,单一依赖阈值过滤的方法可能会遗漏许多潜在的致病性突变,导致发病率被低估。相比之下,HHT-MVP模型在测试数据集上表现出更高的准确性和敏感性,能够更有效地识别那些具有潜在致病性的错义突变。
尽管这些方法提供了更为精确的发病率估算,但研究仍存在一些局限性。首先,所有方法都依赖于主观的注释标准,这可能导致对某些突变的判断存在偏差。例如,如果对“很可能致病性”突变的排除标准更加严格,那么得到的发病率可能更低。其次,尽管HHT-MVP模型在识别错义突变方面表现出色,但其训练数据集仍可能存在不平衡问题,即致病性突变占大多数,而良性突变较少。为了解决这一问题,研究者采用了合成少数过采样技术(SMOTE)来平衡数据集,从而确保模型的准确性。此外,研究还指出,HHT的发病率估算假设了完全的外显率,这在某些情况下可能并不完全成立,尤其是考虑到某些突变可能需要额外的体细胞突变才能引发疾病表现。
HHT的诊断和研究对于公共卫生具有重要意义。由于HHT的症状可能与其他常见疾病相似,且临床医生对其了解不足,因此许多患者可能未能及时确诊。这种低估可能导致患者无法获得适当的治疗和管理,进而影响其生活质量。此外,HHT的发病率被重新估算后,可能对疾病的分类产生影响,例如是否符合“罕见病”的定义。根据美国食品药品监督管理局(FDA)的标准,如果HHT的发病率超过每5000人中有3人,则可能不再被视为罕见病,从而影响相关研究和治疗资源的分配。
在医学研究领域,基因组数据的广泛应用为估算罕见病的发病率提供了新的可能性。通过整合如gnomAD、ClinVar等公共数据库中的信息,可以更全面地识别可能的致病性突变,并减少人为判断的偏差。然而,这种估算方法仍然需要进一步验证,特别是在功能验证方面。目前,对于预测致病性突变的功能性测试仍然存在技术瓶颈,如高成本、低通量和实验操作复杂等问题。因此,研究者建议未来开发更为实用和高效的功能性测试方法,以提高对HHT突变的分类准确性。
综上所述,本文通过多种方法对HHT的发病率进行了估算,并发现其实际发病率可能显著高于现有数据。这不仅揭示了HHT在临床上的低估现象,也强调了需要更精确的诊断工具和更广泛的医学教育来提高对该疾病的认识。此外,研究还表明,机器学习方法在识别HHT相关错义突变方面具有显著优势,有望成为未来HHT研究和诊断的重要工具。从公共卫生角度来看,提高对HHT的重视程度,增加相关研究和治疗资源的投入,对于改善患者预后具有重要意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号