综述:人工智能辅助超声弹性成像在乳腺肿瘤良恶性分类中的性能:系统综述和荟萃分析

《BMC Medical Imaging》:Performance of artificial intelligence-assisted ultrasound elastography in classifying benign and malignant breast tumors: a systematic review and meta-analysis

【字体: 时间:2025年11月04日 来源:BMC Medical Imaging 3.2

编辑推荐:

  本综述首次系统评估了人工智能(AI)辅助超声弹性成像(UE)在乳腺肿瘤良恶性分类中的效能。通过对16项研究的荟萃分析显示,AI辅助UE展现出卓越的诊断性能,汇总敏感性为0.90,特异性为0.88,曲线下面积(AUC)高达0.95。研究指出,尽管存在异质性,深度学习(DL)模型、多模态(如结合B型超声和临床特征)以及外部验证是影响性能的关键因素。该技术有望提升乳腺病变诊断的准确性和一致性,减少不必要的活检,但其临床转化仍需解决算法可解释性、多中心验证及伦理规范等挑战。

  
背景
乳腺癌是全球女性中最常被诊断出的恶性肿瘤,也是导致女性癌症相关死亡的主要原因之一。早期检测和准确区分乳腺肿瘤的良恶性对于制定有效的治疗计划和改善患者预后至关重要。医学影像技术,特别是超声,在乳腺癌筛查和诊断中扮演着重要角色。然而,传统B型超声诊断存在主观性强、假阳性率高等局限性。超声弹性成像(Ultrasound Elastography, UE)通过评估组织硬度的差异,为区分良恶性病变提供了补充信息。近年来,人工智能(Artificial Intelligence, AI)技术的飞速发展,特别是机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL),为医学影像分析带来了革命性的变化。本研究首次通过系统综述和荟萃分析,全面评估AI辅助UE在乳腺肿瘤良恶性分类中的性能。
方法
本研究遵循系统综述和荟萃分析的首选报告项目(PRISMA)指南,并在PROSPERO平台进行了前瞻性注册。研究团队对PubMed、Embase、IEEE Xplore、Web of Science、Cochrane Library、中国知网(CNKI)、万方数据库和中国生物医学文献数据库(CBM)进行了全面的文献检索,时间跨度为2015年1月1日至2025年9月3日。纳入标准包括:评估或开发AI算法用于UE分类乳腺肿瘤良恶性的原始研究;以组织病理学为金标准;基于病灶水平的研究;能够提取真阳性(TP)、假阴性(FN)、真阴性(TN)、假阳性(FP)等诊断准确性数据。排除综述、病例报告、会议摘要等非原始研究。两位研究者独立进行文献筛选、数据提取和质量评价,并使用诊断准确性研究的质量评价工具(QUADAS-AI)评估纳入研究的偏倚风险。采用双变量混合效应模型进行荟萃分析,计算汇总敏感性、特异性、阳性似然比(PLR)、阴性似然比(NLR)、诊断比值比(DOR)和汇总受试者工作特征曲线下面积(AUC)。同时进行异质性检验、敏感性分析、发表偏倚评估和Meta回归分析以探究异质性来源。
结果
纳入研究特征
最终共纳入16项相关研究。所有研究均为回顾性设计,其中13篇以英文发表,3篇以中文发表。仅5项研究包含了独立数据集的外部验证,3项为多中心研究。AI算法类型方面,7项研究使用深度学习(DL),9项研究使用机器学习(ML)。成像模态方面,5项为单模态(仅使用UE),11项为多模态(结合B型超声和/或临床特征)。弹性成像技术中,6项使用剪切波弹性成像(Shear Wave Elastography, SWE),9项使用应变弹性成像(Strain Elastography, SE),1项结合了SWE和SE。
质量评估
根据QUADAS-AI工具的评价结果,在“患者选择”领域,13项研究为低风险,1项为高风险;“指标检验”领域,12项研究为低风险,4项为高风险;“金标准”领域,12项研究为低风险,4项风险不明确;“流程和时序”领域,11项研究为低风险,5项风险不明确。
诊断性能
荟萃分析结果显示,AI辅助UE对乳腺肿瘤良恶性分类具有很高的诊断准确性。汇总敏感性为0.90(95% CI: 0.85-0.94),汇总特异性为0.88(95% CI: 0.81-0.93),阳性似然比(PLR)为7.5(95% CI: 4.7-11.9),阴性似然比(NLR)为0.11(95% CI: 0.07-0.18),诊断比值比(DOR)为67(95% CI: 33-137)。汇总受试者工作特征曲线(SROC)下面积(AUC)达到0.95(95% CI: 0.93-0.97),表明其具有优异的判别能力。
异质性与回归分析
研究间存在显著的异质性(敏感性I2 = 81.98%,特异性I2 = 93.07%),但未发现明显的阈值效应。Meta回归分析表明,样本量(≤300或>300)对敏感性和特异性均有显著影响;算法类型(ML或DL)对敏感性有显著影响;验证形式(内部或外部)、成像模态(单模态或非单模态)、发表年份(2020年前或后)和地理分布(亚洲或非亚洲)对特异性有显著影响。这些因素是异质性的可能来源。
发表偏倚与敏感性分析
Deeks‘漏斗图不对称检验未发现明显的发表偏倚(p=0.66)。留一法敏感性分析显示,逐一排除单项研究后,汇总结果保持稳定,证明了结论的稳健性。
临床实用性
通过Fagan列线图评估AI辅助UE的临床效用。当检查前概率设为48%时,阳性测试结果的后验概率为87%,阴性测试结果的后验概率为9%,表明该技术能有效改变疾病的验后概率,具有重要的临床参考价值。
讨论
本研究表明,AI辅助UE在区分乳腺肿瘤良恶性方面表现出卓越的性能。深度学习(DL)模型因其能够自动从图像中提取高维特征,通常表现出比传统机器学习(ML)模型更高的敏感性。多模态方法(如结合UE、B型超声和临床特征)比单模态UE能更全面地捕获病变信息,从而展现出更好的诊断效能。外部验证是评估AI模型泛化能力的关键,但当前相关研究仍较缺乏。
AI的应用有望克服UE技术本身的一些局限性。例如,对于应变弹性成像(SE),AI可以学习专家评分标准,实现自动化、标准化的评分,减少操作者主观性。对于剪切波弹性成像(SWE),AI可以辅助进行病灶分割和参数测量,减少人为误差,并能有效抑制图像中的伪影。研究表明,AI模型输出的诊断结果具有高度一致性,有助于降低不同观察者间的差异。
然而,AI辅助UE在融入常规临床实践前仍面临诸多挑战。包括工作流程的整合、算法的可解释性(即可解释人工智能XAI)、算法偏见(确保在不同人种和人群中的公平性)、数据质量以及符合各地区法规的监管审批等。未来的研究应侧重于开展前瞻性、多中心、多族裔的临床试验,以进一步验证其有效性和普适性。
结论
本研究首次对AI辅助UE分类乳腺肿瘤良恶性的证据进行了定量合成。结果表明该技术具有巨大的应用潜力,汇总AUC高达0.95,诊断性能优异。然而,现有研究质量的差异和较高的异质性要求对结论的解释需保持谨慎。未来的工作应致力于进行更多设计严谨、多中心合作、涵盖不同族裔的前瞻性研究,以进一步提升AI辅助UE在乳腺病变分类中的泛化能力和临床转化价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号