
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于电子健康记录与深度学习的努南综合征早期筛查模型:真实世界验证与遗传测序评估
【字体: 大 中 小 】 时间:2025年07月23日 来源:npj Genomic Medicine 4.7
编辑推荐:
本研究针对罕见遗传病努南综合征(NS)诊断延迟的临床难题,开发了基于电子健康记录(EHR)的深度学习筛查模型。研究人员通过分析92,428例儿科患者的临床数据,结合遗传测序验证,证实该模型能以99.82%特异性识别潜在病例,发现5例新确诊NS患者。研究首次实现AI筛查工具在真实临床场景中的转化应用,为罕见病早期诊断提供新范式。
在儿科遗传病领域,努南综合征(Noonan syndrome, NS)作为RAS/MAPK信号通路异常的典型代表,每1000-2500名新生儿中就有1例发病。这种常染色体显性遗传病以特征性面容、心脏畸形和生长迟缓为临床表现,却因表型异质性常被漏诊——患者平均需辗转5.3个专科、历时7.2年才能确诊。更严峻的是,约20%的临床疑似病例无法通过现有基因检测找到致病突变,这种"诊断黑洞"使得大量患者错失早期干预时机。
辛辛那提儿童医院医学中心(Cincinnati Children's Hospital Medical Center)的研究团队另辟蹊径,将人工智能与临床大数据深度融合。他们开发的深度卷积神经网络(DCNN)模型通过挖掘电子健康记录(EHR)中14,969,183条诊断文本,构建起NS的数字化筛查体系。这项发表于《npj Genomic Medicine》的研究首次在真实临床场景中验证了AI筛查工具的有效性,为破解罕见病诊断困境提供了创新解决方案。
研究团队采用多模态技术路线:首先利用预训练的DCNN模型对92,493例生物样本库患者的EHR数据进行风险评分;随后对171例高风险患者(评分>0.8)进行系统病历审查,排除86例已有明确遗传诊断者;最终对剩余85例开展全外显子测序(WES)或全基因组测序(WGS),结合ACMG指南进行变异解读。创新性地引入人类表型本体(HPO)进行表型富集分析,并开发轨迹模型追踪患者临床特征演变规律。
模型风险评分分布
分析显示模型评分呈显著右偏态分布,均值仅0.004,而171例高风险患者(0.19%)评分超过0.8阈值。线性回归揭示评分与性别、种族存在显著关联——男性评分高于女性(β=0.11,p<0.001),白人患者评分高于黑人(β=0.07,p=0.003),这些发现反映了临床实践中的人口学差异。
遗传验证结果
在完成测序的83例患者中,发现2例NS新确诊病例:Patient D携带PTPN11基因c.1529A>G(p.Gln510Arg)致病突变,该变异通过PM5/PP3/PM1等ACMG条款验证;Patient E检出NF1基因c.3285_3294del框内缺失,其临床表型与NS存在显著重叠。结合研究期间通过常规诊疗确诊的3例NS患者,模型整体阳性预测值达2.92%(5/171),特异性保持99.82%。值得注意的是,假阳性病例中15例最终确诊为阿拉杰里综合征(Alagille syndrome),13例为威廉姆斯综合征,揭示NS与其他遗传病存在广泛表型重叠。
表型特征解析
HPO分析显示高风险患者显著富集NS相关表型:肺动脉瓣狭窄(OR=47.2)、房间隔缺损(OR=38.6)、生长迟缓(OR=29.4)等。与已知NS患者相比,模型识别病例的心脏异常表型相似,但特征性面容如眼睑下垂(ptosis)的文档率低60%,凸显EHR数据捕获临床特征的局限性。
诊断时间窗分析
纵向轨迹模型揭示5例确诊患者的风险评分演变规律:Patient C因4.39岁记录"肺动脉瓣狭窄"导致评分骤升,而Patient B的评分随"先天性血小板减少"等非典型症状呈现阶梯式上升。所有病例在确诊前3-5年即出现评分异常,证实模型具有早期预警潜力。
这项研究标志着罕见病筛查进入智能时代。通过将深度学习与多组学数据整合,研究人员首次实现NS的规模化主动筛查,打破传统"临床怀疑-基因验证"的被动模式。虽然2.92%的阳性预测值看似不高,但在NS真实患病率(1/7379)背景下,这相当于将诊断效率提升40倍。更深远的意义在于,该框架可扩展至其他罕见病——研究揭示的"表型重叠陷阱"直接推动团队开发多疾病分类模型,而轨迹分析方法为捕捉发育性疾病动态特征树立新范式。随着EHR系统的完善和AI算法的迭代,这种"数字筛子"有望成为遗传病诊疗体系的标准配置,让更多"隐藏"患者获得精准诊疗机会。
生物通微信公众号
知名企业招聘