综述:机器学习方法在药物流行病学中的预测效果是否优于传统方法?一项系统评价、荟萃分析和网络荟萃分析
《Artificial Intelligence in Medicine》:Do machine learning methods make better predictions than conventional ones in pharmacoepidemiology? A systematic review, meta-analysis, and network meta-analysis
【字体:
大
中
小
】
时间:2025年11月25日
来源:Artificial Intelligence in Medicine 6.2
编辑推荐:
本研究系统综述2018年1月至2025年9月发表的药物流行病学预测研究,比较传统统计模型与机器学习方法的性能。结果显示,84%的预测目标中机器学习方法表现更优,尤其梯度提升方法(如GBM和XGBoost)。但存在方法学报告不充分的问题,建议加强透明度和可重复性。
安娜·保拉·布鲁诺·佩纳-格拉莱(Ana Paula Bruno Pena-Gralle)| 米雷耶·E·施尼策(Mireille E. Schnitzer)| 索菲亚-娜达·布雷瓜(Sofia-Nada Boureguaa)| 费利克斯·莫兰(Félix Morin)| 马克-安德烈·勒高(Marc-André Legault)| 卡罗琳·西罗瓦(Caroline Sirois)| 艾丽丝·德拉戈米尔(Alice Dragomir)| 露西·布莱斯(Lucie Blais)
加拿大魁北克省蒙特利尔市蒙特利尔大学药学院
摘要
目的
综合现有证据,比较传统统计(CS)模型与机器学习(ML)方法在药物流行病学中的预测性能。
方法
系统检索了2018年1月至2025年9月期间发表的预测性药物流行病学研究,数据来源包括Medline、Embase、PsycINFO、CINHAL和Web of Science数据库。独立评审人员从每项研究中提取预测指标和其他数据,并评估了各种方法之间的比较质量。针对每个预测目标,估算了ML相对于CS的相对性能。通过元分析(meta-analyses)和贝叶斯网络元分析(NMA)汇总了性能指标。
结果
在识别出的9106条记录中,有65项研究符合纳入标准,涵盖了83个预测目标。对于其中84%的目标,至少有一种ML方法的性能优于CS方法。这些研究的中位样本量为2691名受试者(范围从50到1,807,159名),对于二元结果,每个候选预测因子的事件中位数为17.9(范围从0.28到24,260)。根据至少八个主要标准中的任何一个,有39个预测目标存在偏倚风险。
在偏倚风险较低的研究中,表现最佳的ML方法的接收者操作者曲线下面积(AUC)比率为1.07(95%置信区间1.03–1.12),但异质性非常高。197项比较的NMA结果显示,提升型方法(boosted methods)的AUC比率为1.07(95%可信区间1.04–1.12),其中梯度提升机(Gradient Boosting Machine)和XGBoost被一致评为表现最佳的方法。
结论
应用于结构化药物流行病学数据的机器学习方法在判别性能上显示出相对于传统统计模型的稳定但适度的优势。这种优势在提升型方法(如GBM和XGBoost)中尤为明显。然而,建议更严格地报告方法学细节,以提高研究的可理解性、透明度和可重复性。
注册信息
PROSPERO 2023注册编号:CRD42023426986。
部分内容摘要
背景
药物流行病学旨在增进我们对药物使用带来的益处和风险的理解,从而指导临床实践和公共卫生政策。该领域经常开展药物上市后的研究,以揭示商业前临床试验中未涉及的信息[1]。
用于预测结果的模型是这一领域中不可或缺的工具,传统上依赖于逻辑回归、线性回归和Cox比例风险回归方法。
方法
本系统评价遵循了PRISMA指南和NMA扩展声明[7,8]。研究方案于2023年在PROSPERO注册(CRD42023426986),方案偏离情况在补充材料1中报告。
结果
在排除重复项后,我们确定了2018年1月至2025年9月期间发表的9106篇潜在符合条件的文献。初步筛选基于标题和摘要,认为8352篇研究不相关。剩余的754篇研究经过全文审查,其中390篇被排除;最常见的排除原因是缺乏任何比较分析。在包含至少一项比较的364篇研究中,进一步排除了其他原因。
讨论
本系统评价汇总了自2018年以来发表的药物流行病学预测研究的结果,比较了ML方法与CS模型的性能。我们可视化了所有研究中ML方法与CS方法的相对性能,估算了每种方法相对于逻辑回归的最高性能ML方法的汇总AUC比率,并通过NMA同时估算了ML方法之间以及不同ML方法家族之间的AUC比率。
结论
我们发现,应用于药物流行病学预测研究的机器学习方法在判别性能上相对于传统统计模型表现出适度但稳定的优势。这种优势在提升型方法(如GBM和XGBoost)中尤为明显。然而,建议更严格地报告方法学细节,并公开算法代码,以提高研究的可理解性、透明度和可重复性。
作者贡献声明
安娜·保拉·布鲁诺·佩纳-格拉莱:撰写——审阅与编辑、初稿撰写、可视化、验证、监督、软件使用、资源协调、项目管理、方法学设计、数据整理、概念构思。米雷耶·E·施尼策:撰写——审阅与编辑、可视化、验证、监督、资源协调、项目管理、方法学设计、数据整理、概念构思。索菲亚-娜达·布雷瓜:撰写——审阅与编辑、可视化
关于写作过程中生成式AI和AI辅助技术的声明
在准备本工作时,作者使用ChatGPT对英文文本进行了润色。使用该工具后,作者根据需要对内容进行了审阅和编辑,并对出版物的内容负全责。
资助
本研究得到了魁北克药物研究网络(Réseau québécois de recherche sur les médicaments)对布莱斯博士(Dr. Blais)的资助。施尼策博士是加拿大卫生研究院(CIHR)在因果推断和健康科学领域的研究主席。西罗瓦博士获得了魁北克研究基金会(Fonds de recherche du Québec – Santé)的青年研究奖学金,勒高博士获得了加拿大卫生研究院(CIHR)的资助。
利益冲突声明
布莱斯博士从阿斯利康(AstraZeneca)获得了资助和个人费用,从泰瓦(TEVA)和葛兰素史克(GlaxoSmithKline)获得了资助。施尼策博士从Carebook Technologies Inc.获得了个人费用,但这些费用与提交的工作无关。其他作者声明没有已知的可能会影响本综述所报告工作的利益冲突或个人关系。
致谢
我们想感谢麦吉尔大学(McGill University)的拉塞尔·斯蒂尔(Russell Steele)博士在分析设计方面提供的宝贵意见。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号