机器学习算法FIND-FH在家族性高胆固醇血症疑似患者识别中的性能评估:一项真实世界研究

【字体: 时间:2025年08月03日 来源:Journal of Clinical Lipidology 4.6

编辑推荐:

  本研究评估了机器学习算法FIND-FH(Find, Identify, Network, Deliver-FH)在真实世界电子健康记录(EHR)数据中识别家族性高胆固醇血症(FH)患者的性能。研究发现该算法能有效识别传统LDL-C筛查策略可能漏诊的高风险人群(53%患者LDL-C<190 mg/dL),56%的阳性病例具有足够临床依据值得进一步评估,为FH的早期诊断提供了新思路。

  

Highlight

机器学习算法为心脏疾病风险人群识别提供了可扩展的解决方案。2016年家庭心脏基金会开发的FIND-FH算法基于随机森林模型,通过分析电子健康记录(EHR)中80,000余例患者数据,可计算FH疑似概率评分。前期验证显示其在医疗系统中识别FH疑似患者的准确率达77-87%。

Methods

FIND-FH模型采用双层随机森林架构,训练数据来自4个大型学术医疗系统3年间的EHR数据(2013.9.1-2016.8.31)。模型包含>60,000个输入特征,涵盖人口统计学、用药史等维度。本研究将其应用于UT西南医学中心的真实世界EHR数据,对评分>0.35的高概率人群进行人工病历复核,采用改良Simon-Broome和荷兰脂质网络(DLCN)标准验证诊断准确性。

Results

在93,418例EHR数据中,算法识别出340例FH高概率患者(平均年龄49.8岁,59%男性)。这些患者最高LDL-C均值为168.4±51.9 mg/dL,其中68%患者LDL-C<190 mg/dL。20-32%符合改良Simon-Broome或DLCN的"可能FH"标准。不同评分五分位数组间存在显著表型差异,56%(191例)具有足够临床依据值得开展随访。值得注意的是,53%的随访适宜患者(101例)最高LDL-C<190 mg/dL,这意味着传统LDL-C筛查策略会漏诊这些病例。

Discussion

本研究首次在真实世界临床样本中验证FIND-FH算法性能。虽然多数患者缺乏确诊FH的完整临床数据,但算法成功识别出值得随访的高风险人群,特别是那些LDL-C未达传统筛查阈值却表现出典型FH表型的个体。该发现对优化FH筛查策略具有重要意义,提示机器学习算法可弥补传统生化筛查的局限性。

Conclusion

在大型医疗系统EHR数据中,FIND-FH算法识别的高FH风险人群大多值得进一步评估,尽管现有数据不足以完全满足FH诊断标准。这些发现支持机器学习在改善FH诊断率方面的应用价值,特别是对非典型LDL-C水平的潜在患者识别具有独特优势。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号