人工智能模型在超声检测腹部创伤中的诊断准确性:一项系统评价与荟萃分析
《Meta-Radiology》:Diagnostic Accuracy of Artificial Intelligence Models in Ultrasound-Based Detection of Abdominal Trauma: A Systematic Review and Meta-Analysis
【字体:
大
中
小
】
时间:2025年11月02日
来源:Meta-Radiology CS10.2
编辑推荐:
本刊编辑推荐:为解决腹部创伤超声检测中操作者依赖性强、诊断准确性不稳定的临床难题,研究人员开展了关于人工智能(AI)模型在FAST(创伤重点超声评估)中应用价值的系统评价与荟萃分析。研究结果显示AI模型具有90.7%的敏感性和96.9%的特异性,AUC达0.979,表明AI可显著提升腹部创伤的超声诊断准确性,对急诊医学具有重要临床意义。
在急诊医学领域,每一分钟都关乎生死。当腹部创伤患者被送入急诊室时,快速准确地判断是否存在内出血成为挽救生命的关键。创伤重点超声评估(FAST)因其便携、实时、可在床边对不稳定患者进行检查等优势,成为急诊腹部创伤评估的基石技术,并已完全整合到高级创伤生命支持(ATLS)算法中。然而,这一沿用二十余年的技术面临着严峻挑战:它对无明显腹腔积血的实质性脏器损伤敏感性有限,且诊断性能高度依赖操作者经验,导致观察者间变异较大,可能产生假阴性结果并延误治疗。
即使对比增强超声(CEUS)等新技术在一定程度上提升了检测实质脏器损伤和活动性出血的敏感性及特异性,其诊断准确性接近计算机断层扫描(CT),同时保留了可重复性和安全性优势,但这些技术仍受限于技术挑战和判读差异。这些瓶颈问题凸显了对标准化成像协议的需求,以及将人工智能(AI)技术整合到创伤护理流程中的迫切性。
人工智能,特别是通过机器学习(ML)和深度学习(DL)技术,正在迅速改变超声为基础的创伤检测领域。卷积神经网络(CNN)在分类创伤性损伤(如弹片检测)方面展现出令人印象深刻的能力,在组织体模和动物模型中F1分数和AUC值超过0.95。此外,AI驱动系统在标准化FAST检查判读方面已被证明有效,在评估视图充足性和识别积液存在方面准确率分别高达97%和94%,从而最小化对专家判读的依赖,促进更统一的临床决策。
在此背景下,Helvécio N. Feitosa Filho等研究人员在《Meta-Radiology》上发表了题为"Diagnostic Accuracy of Artificial Intelligence Models in Ultrasound-Based Detection of Abdominal Trauma: A Systematic Review and Meta-Analysis"的研究论文,对AI模型在超声检测腹部创伤中的诊断性能进行了系统评价和荟萃分析。
为开展这项研究,研究人员采用了系统评价和荟萃分析的方法,遵循PRISMA-DTA(系统评价和荟萃分析的首选报告项目:诊断试验准确性)2018指南。他们检索了MEDLINE、Embase和Cochrane图书馆数据库,使用与腹部创伤、超声检查(包括FAST和POCUS)以及人工智能(包括机器学习和深度学习)相关的检索词组合。研究纳入标准基于PICOS框架,包括使用超声评估腹部创伤的患者、应用AI技术检测损伤、以专家放射学判读为参考标准、报告诊断性能指标的研究设计。数据分析采用R软件进行,使用双变量随机效应模型计算汇总敏感性、特异性及SROC曲线下面积(AUC),并通过I2统计量评估异质性。
研究最终纳入了5项符合标准的研究,共评估了209,577帧超声图像。这些研究均采用回顾性设计,其中四项为单中心研究,一项为多中心研究。地理分布上,三项研究来自美国,一项来自中国台湾,一项来自韩国。就AI模型而言,两项研究采用机器学习算法,三项采用深度学习架构。所有研究的主要目标都是FAST检查中腹部游离液或腹腔积血的自动检测或判读。
使用QUADAS-2工具进行的偏倚风险评估显示,纳入的研究中存在方法学异质性。患者选择和流程时序是受影响最多的领域。Deeks漏斗图不对称检验表明,不存在小样本效应或发表偏倚的证据(t = -0.40; p = 0.728),支持了汇总诊断估计的稳健性。
汇总分析显示,AI模型的合并敏感性为90.7%(95% CI: 79.1–96.2%),合并特异性为96.9%(95% CI: 95.1–98.0%)。SROC曲线下面积(AUC)为0.979(95% CI: 0.964–0.983),表明总体诊断准确性极佳。合并诊断比值比(DOR)为332.4(95% CI: 129.4–854.0; p < 0.001),表明具有出色的总体诊断判别能力。然而,观察到显著的异质性(I2 = 99% 敏感性,89% 特异性)。
留一法敏感性分析发现,Cheng等人(2021)的研究是特异性异质性的主要贡献者。排除该研究后,特异性的I2从98%显著降至58%。敏感性与特异性之间的Spearman相关系数为-0.302,表明存在轻度至中度的阈值效应,反映了不同研究应用的诊断阈值存在差异。
分层汇总ROC(HSROC)模型得出的汇总敏感性为90.6%(95% CI: 77.7–96.4%),假阳性率为3.4%(95% CI: 2.4–4.7%)。汇总AUC为0.979,与双变量模型结果一致。
元回归分析表明,使用更多帧图像(>1000帧)的研究与敏感性显著升高相关(logit系数=1.665; p=0.013)。与美国进行的研究相比,在亚洲进行的研究显示出敏感性升高的趋势,但未达到统计学显著性(p=0.065)。此外,与ML模型相比,DL模型与较高的假阳性率显著相关(logit系数=0.620; p=0.021)。
研究的讨论部分深入分析了结果的意义。AI在腹部和急诊超声中的应用已显示出显著进展,特别是在提高诊断准确性和减少操作者依赖性方面。本荟萃分析纳入的研究展示了AI模型在FAST检查中检测游离液的高诊断性能。然而,作者也指出了临床实施面临的多重障碍和考量因素。元回归分析强调了大型、多样化数据集对于训练具有稳健诊断性能的AI模型至关重要。研究还观察到不同地区(美国与亚洲)和研究采用的AI模型类型(ML与DL)对性能指标的影响趋势,提示了诊断阈值选择和技术路径的差异。
成功将AI整合到FAST检查中需要一个结合技术和操作考量的多层面方法。这包括制定标准化图像采集协议、对医护人员进行培训、与现有医院信息系统无缝集成、建立实时反馈机制,以及在批量大的创伤中心进行试点研究。此外,清晰的监管路径和伦理考量,如患者自主权、数据隐私、算法透明度和临床决策中的问责制,对于确保安全、有效和公平地整合AI辅助的FAST检查到常规创伤护理中至关重要。
本研究作为首个评估AI模型在FAST超声检查中检测游离液或腹腔积血诊断性能的系统评价和荟萃分析,具有重要价值。其优势在于使用了稳健的统计方法,并提供了有价值的性能基准。然而,研究也存在一些局限性,包括纳入研究数量少、多为回顾性单中心设计、验证队列规模相对较小且异质性强、图像采集协议缺乏标准化、机器学习方法存在异质性以及存在谱偏倚的可能性。较高的统计异质性和无法按临床相关变量(如创伤机制、液体位置)分层结果也限制了结果的深入解读。
综上所述,这项研究证实了AI模型在FAST检查中检测腹部游离液具有优异的诊断准确性,为AI作为辅助工具提升急诊创伤护理的诊断速度和减少操作者依赖性提供了证据支持。然而,要将AI辅助的FAST成功转化为临床实践,还需要多中心前瞻性研究、更大更多样的图像数据集以及标准化成像采集和AI验证协议的建立。未来的研究还应探讨AI部署的成本效益、实时集成和伦理影响,以确保在全球多样化的医疗环境中实现安全、公平和可扩展的应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号