
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习算法FIND-FH在家族性高胆固醇血症疑似患者识别中的性能评估:一项真实世界研究
【字体: 大 中 小 】 时间:2025年08月03日 来源:Journal of Clinical Lipidology 4.6
编辑推荐:
本研究评估了机器学习算法FIND-FH(Find, Identify, Network, Deliver-FH)在真实世界电子健康记录(EHR)数据中识别家族性高胆固醇血症(FH)患者的性能。研究发现该算法能有效识别传统LDL-C筛查策略可能漏诊的高风险人群(53%患者LDL-C<190 mg/dL),56%的阳性病例具有足够临床依据值得进一步评估,为FH的早期诊断提供了新思路。
Highlight
机器学习算法为心脏疾病风险人群识别提供了可扩展的解决方案。2016年家庭心脏基金会开发的FIND-FH算法基于随机森林模型,通过分析电子健康记录(EHR)中80,000余例患者数据,可计算FH疑似概率评分。前期验证显示其在医疗系统中识别FH疑似患者的准确率达77-87%。
Methods
FIND-FH模型采用双层随机森林架构,训练数据来自4个大型学术医疗系统3年间的EHR数据(2013.9.1-2016.8.31)。模型包含>60,000个输入特征,涵盖人口统计学、用药史等维度。本研究将其应用于UT西南医学中心的真实世界EHR数据,对评分>0.35的高概率人群进行人工病历复核,采用改良Simon-Broome和荷兰脂质网络(DLCN)标准验证诊断准确性。
Results
在93,418例EHR数据中,算法识别出340例FH高概率患者(平均年龄49.8岁,59%男性)。这些患者最高LDL-C均值为168.4±51.9 mg/dL,其中68%患者LDL-C<190 mg/dL。20-32%符合改良Simon-Broome或DLCN的"可能FH"标准。不同评分五分位数组间存在显著表型差异,56%(191例)具有足够临床依据值得开展随访。值得注意的是,53%的随访适宜患者(101例)最高LDL-C<190 mg/dL,这意味着传统LDL-C筛查策略会漏诊这些病例。
Discussion
本研究首次在真实世界临床样本中验证FIND-FH算法性能。虽然多数患者缺乏确诊FH的完整临床数据,但算法成功识别出值得随访的高风险人群,特别是那些LDL-C未达传统筛查阈值却表现出典型FH表型的个体。该发现对优化FH筛查策略具有重要意义,提示机器学习算法可弥补传统生化筛查的局限性。
Conclusion
在大型医疗系统EHR数据中,FIND-FH算法识别的高FH风险人群大多值得进一步评估,尽管现有数据不足以完全满足FH诊断标准。这些发现支持机器学习在改善FH诊断率方面的应用价值,特别是对非典型LDL-C水平的潜在患者识别具有独特优势。
生物通微信公众号
知名企业招聘