
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的遗传变异外显率精准评估模型构建及其临床应用价值
【字体: 大 中 小 】 时间:2025年08月31日 来源:SCIENCE 45.8
编辑推荐:
【编辑推荐】来自多机构的研究团队利用机器学习(ML)整合134万份电子健康档案(EHR)与外显子组数据,开发了10种遗传性疾病的外显率评估新方法。该研究通过临床实验室指标构建疾病概率评分,定量解析1648个罕见变异(含VUS和LoF变异)的临床意义,证实ML外显率与传统致病性分类(P/B/VUS)具有生物学一致性,为精准医学提供了可扩展的风险评估范式。
这项突破性研究开创性地将机器学习(ML)技术与深度表型分析相结合,为遗传变异的外显率评估带来全新解决方案。研究团队首先构建了10种典型遗传性疾病(包括致心律失常性右室心肌病、林奇综合征等)的预测模型,通过分析134万参与者的电子健康档案(EHR)数据,提取临床实验室检测指标生成连续性疾病评分。
在技术路线上,研究者巧妙地将这些ML模型应用于独立的外显子测序队列,系统评估了31个常染色体显性遗传病相关基因中的1648个罕见变异。结果显示:机器学习外显率(ML penetrance)呈现显著层级差异——致病性变异(P)和功能缺失变异(LoF)外显率最高,意义未明变异(VUS)次之,良性变异(B)最低。这种定量评估方式较传统病例-对照研究能更精确反映疾病风险谱。
特别值得注意的是,该方法展现出卓越的临床转化价值:
与疾病特异性终点事件显著相关,如多囊肾病(PKD)变异携带者的终末期肾病风险、肥厚型心肌病(HCM)变异者的心衰风险
与实验功能测定结果高度一致,证实其生物学合理性
成功解析VUS的临床轨迹——高外显率变异携带者随时间推移表现出特征性异常:家族性高胆固醇血症(FH)变异者低密度脂蛋白胆固醇(LDL-C)升高119 mg/dl,PKD变异者肾小球滤过率(eGFR)降低40 ml/min
该研究建立的ML外显率评估框架,通过整合基因组数据与临床多维表型,实现了三大创新:
• 突破传统家系研究的样本量限制
• 克服病例-对照二元分类的过度简化
• 为ClinVar数据库中争议性变异提供数据驱动的解读方案
这项发表于《科学》杂志的成果,不仅为10种遗传病提供了现成的风险评估工具,更重要的是建立了可推广到其他疾病的研究范式,标志着精准医学向数据驱动、定量化方向迈出关键一步。
生物通微信公众号
知名企业招聘