综述:机器学习预测糖尿病相关截肢的诊断试验准确性的系统评价和荟萃分析

【字体: 时间:2025年05月12日 来源:Clinical and Experimental Medicine 3.2

编辑推荐:

  本文通过系统评价和荟萃分析评估机器学习预测糖尿病相关截肢(DRA)的准确性。研究发现其准确性中等(AUC 为 0.81) ,但存在一定局限性,为后续多中心、大样本研究提供方向。

  

机器学习预测糖尿病相关截肢的研究背景


糖尿病相关截肢(Diabetes-related Amputation,DRA)是糖尿病的严重并发症,约 85% 的非创伤性截肢发生在糖尿病患者中,且至少 80% 在截肢前存在足部病变。DRA 影响患者生活质量、增加经济负担,因此早期预测和干预至关重要。近年来,机器学习在医学领域应用增多,在 DRA 监测和诊断方面也受到关注,但不同研究中其预测准确性差异大,且缺乏相关系统评价和荟萃分析。

研究方法


本研究遵循系统评价和荟萃分析诊断试验准确性研究(PRISMA-DTA)指南,在国际前瞻性系统评价注册平台(PROSPERO)注册(编号:CRD42024570834) 。由两名独立研究人员检索 PubMed、Web of Science、Embase、Scopus、Cochrane Library、万方和中国知网(CNKI)等数据库,检索时间从建库至 2024 年 12 月,检索语言为英文和中文。检索词包括 “AI”“机器学习模型”“糖尿病”“截肢” 等。

  1. 纳入与排除标准:纳入评估机器学习预测 DRA 风险价值的队列研究,要求文献明确描述 DRA 诊断标准、提供或可计算敏感性、特异性及最佳诊断阈值。排除系统评价、综述、病例报告、数据不完整、重复、全文不可获取及有争议或撤回的文献。
  2. 数据提取与质量评价:对符合标准的研究进行数据提取,包括诊断试验、指标试验、真阳性(TP)、真阴性(TN)、假阳性(FP)和假阴性(FN)等数据。使用诊断准确性研究质量评价 - 2(QUADAS-2)质量评分标准评估文献质量。
  3. 统计分析:运用 RevMan 5.4、meta-disc 软件和 Stata 16.0 进行统计分析。绘制汇总受试者工作特征曲线(SROC)并计算曲线下面积(AUC)评估诊断性能;用 Deeks 漏斗图不对称性检验评估发表偏倚;绘制 Fagan 图计算验前概率和验后概率评估临床价值;通过 Spearman 相关系数评估阈值效应,采用双变量随机效应模型估计合并效应量;用统计量I2和 Q 检验分析异质性,进行亚组分析和 meta 回归探索异质性来源;使用推荐分级评估、制定与评价(GRADE)方法评估证据质量。

研究结果


  1. 文献筛选结果:初筛 1785 篇文献,经去重、排除不符合标准文献后,最终 7 项研究纳入分析。
  2. 纳入研究基本特征:7 项研究中,中国 3 项,美国 2 项,西班牙和土耳其各 1 项。均为回顾性队列研究,共纳入 105,928 例患者,实验组 6220 例,对照组 99,708 例,患者年龄 26 - 88 岁,男性比例 53.8% - 65%。
  3. 质量评估结果:多数纳入研究满足 QUADAS-2 多数项目,整体质量中等偏上,两项研究得分较低,但经详细审查后仍纳入分析。
  4. 诊断性能结果:采用随机效应模型计算合并诊断参数。7 项研究敏感性范围 0.70 - 0.75,特异性范围 0.84 - 0.92。合并阳性似然比(PLR)为 3.62(95% CI 3.36 - 3.89) ,合并阴性似然比(NLR)为 0.32(95% CI 0.30 - 0.35) ,合并诊断优势比(DOR)为 13.55(95% CI 11.72 - 15.67) ,SROC 曲线 AUC 值为 0.81,表明机器学习预测 DRA 有一定准确性。
  5. 临床价值分析结果:Fagan 图分析显示,机器学习检测阳性时,概率从 20% 增至 62%;检测阴性时,概率降至 7% 。
  6. 异质性分析结果:亚组分析和 meta 回归表明,偏倚水平和发表年份是敏感性和特异性异质性的来源,机器学习类型和样本量不是异质性来源。
  7. 敏感性分析和发表偏倚结果:敏感性分析排除 3 项异常值研究后,结果仍稳健。Deeks 漏斗图不对称性检验P=0.07 ,提示发表偏倚可能性小。
  8. 证据质量评估结果:GRADE 评估显示,初始证据水平为 “低” ,经降级因素调整后,最终证据水平为 “极低”。

讨论


本研究证实机器学习诊断 DRA 准确性中等(AUC = 0.81),敏感性 0.72、特异性 0.89 。机器学习在排除非 DRA 方面有一定作用,但敏感性略低,临床可能需结合其他诊断方法。与传统方法相比,机器学习对非糖尿病截肢的鉴别能力更强,但敏感性不足,可能与小样本导致的特征学习不充分有关。
研究发现异质性主要源于样本量和发表年份,早期研究多基于单中心小样本,依赖单一特征;近期研究开始整合多维度数据,但算法架构差异也可能加剧异质性。本研究存在局限性,符合纳入标准的文献少,可能影响结果稳健性;多数研究样本量小、单中心,存在选择偏倚;纳入研究语言局限于英文和中文;因研究数量有限,不能完全排除发表偏倚。总体而言,机器学习可预测 DRA,但需多中心、大样本和前瞻性研究进一步验证其有效性和适用性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号