
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:机器学习在疾病预测与管理中分析真实世界数据的应用:系统评价
【字体: 大 中 小 】 时间:2025年06月30日 来源:JMIR Medical Informatics 3.1
编辑推荐:
这篇系统评价全面探讨了机器学习(ML)在真实世界数据(RWD)分析中的临床应用,重点聚焦心血管疾病(33%研究)、癌症(16%)和神经系统疾病(11%)的预测与管理。研究显示随机森林(RF,42%)、逻辑回归(LR,37%)和支持向量机(SVM,32%)是最常用算法,电子健康记录(EHRs,68%)为主要数据源。尽管ML模型在AUC(如RF模型0.85)和特异性(如SVM达98.7%)方面表现优异,但数据质量、模型可解释性和泛化能力仍是主要挑战。
背景
机器学习(ML)与大数据分析正在重塑医疗健康领域,尤其在疾病预测、管理和个性化医疗方面展现出巨大潜力。随着电子健康记录(EHRs)、患者登记系统和可穿戴设备等多样化真实世界数据(RWD)的普及,ML技术为改善临床结局提供了新机遇。然而,数据质量、模型透明度、泛化能力及临床整合等挑战仍亟待解决。
方法
本研究遵循PRISMA指南,系统检索了2014-2024年间应用ML分析RWD的57项研究(总样本>15万例)。通过PubMed、Scopus等数据库筛选临床试验和队列研究,重点提取ML算法类型(如监督学习、深度学习)、疾病类别、研究设计(如随机对照试验)及RWD来源等数据。
核心发现
算法应用特征
疾病领域分布
心血管疾病研究独占鳌头(19篇),其中:
数据源比较
电子健康记录(EHRs)占主导地位(39篇),在败血症早期预警(XGBoost模型AUROC 0.88)和癫痫手术转诊(NLP系统PPV 0.25)中表现突出。可穿戴设备虽仅占4篇,但在房颤高频事件(AHREs)监测中RF模型AUROC达0.742。
挑战与突破
未来方向
FDA和EMA正在建立ML医疗应用的监管路径,强调:
该综述为ML在真实世界医疗场景的转化研究提供了方法论范本,其揭示的技术-临床-监管三重挑战,将深刻影响精准医学的发展轨迹。
生物通微信公众号
知名企业招聘