机器学习算法FIND-FH在家族性高胆固醇血症疑似患者识别中的性能评估：一项真实世界研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月03日 来源：Journal of Clinical Lipidology 4.6

编辑推荐：

　　本研究评估了机器学习算法FIND-FH（Find, Identify, Network, Deliver-FH）在真实世界电子健康记录（EHR）数据中识别家族性高胆固醇血症（FH）患者的性能。研究发现该算法能有效识别传统LDL-C筛查策略可能漏诊的高风险人群（53%患者LDL-C<190 mg/dL），56%的阳性病例具有足够临床依据值得进一步评估，为FH的早期诊断提供了新思路。

Highlight

机器学习算法为心脏疾病风险人群识别提供了可扩展的解决方案。2016年家庭心脏基金会开发的FIND-FH算法基于随机森林模型，通过分析电子健康记录(EHR)中80,000余例患者数据，可计算FH疑似概率评分。前期验证显示其在医疗系统中识别FH疑似患者的准确率达77-87%。

Methods

FIND-FH模型采用双层随机森林架构，训练数据来自4个大型学术医疗系统3年间的EHR数据（2013.9.1-2016.8.31）。模型包含>60,000个输入特征，涵盖人口统计学、用药史等维度。本研究将其应用于UT西南医学中心的真实世界EHR数据，对评分>0.35的高概率人群进行人工病历复核，采用改良Simon-Broome和荷兰脂质网络(DLCN)标准验证诊断准确性。

Results

在93,418例EHR数据中，算法识别出340例FH高概率患者（平均年龄49.8岁，59%男性）。这些患者最高LDL-C均值为168.4±51.9 mg/dL，其中68%患者LDL-C<190 mg/dL。20-32%符合改良Simon-Broome或DLCN的"可能FH"标准。不同评分五分位数组间存在显著表型差异，56%（191例）具有足够临床依据值得开展随访。值得注意的是，53%的随访适宜患者（101例）最高LDL-C<190 mg/dL，这意味着传统LDL-C筛查策略会漏诊这些病例。

Discussion

本研究首次在真实世界临床样本中验证FIND-FH算法性能。虽然多数患者缺乏确诊FH的完整临床数据，但算法成功识别出值得随访的高风险人群，特别是那些LDL-C未达传统筛查阈值却表现出典型FH表型的个体。该发现对优化FH筛查策略具有重要意义，提示机器学习算法可弥补传统生化筛查的局限性。

Conclusion

在大型医疗系统EHR数据中，FIND-FH算法识别的高FH风险人群大多值得进一步评估，尽管现有数据不足以完全满足FH诊断标准。这些发现支持机器学习在改善FH诊断率方面的应用价值，特别是对非典型LDL-C水平的潜在患者识别具有独特优势。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号