综述:人工智能在食管手术中的应用:一项系统性评价
《Journal of Robotic Surgery》:Application of artificial intelligence in esophageal surgery: a systematic review
【字体:
大
中
小
】
时间:2025年10月18日
来源:Journal of Robotic Surgery 3
编辑推荐:
本综述系统分析了人工智能(AI)在食管切除术中的应用,聚焦于解剖结构识别、器械检测及手术阶段识别。尽管相关研究数量有限(仅6篇符合纳入标准),但AI已展现出实时识别关键结构(如喉返神经,Dice系数达0.58,接近专家水平0.62)和优化手术流程(阶段识别准确率最高达84%)的潜力。未来需通过多中心合作、标准化数据集及前瞻性临床试验,推动AI在食管微创手术(MIE/RAMIE)中的临床转化与整合。
引言
食管癌是全球第七大常见癌症和第六大癌症相关死亡原因,食管切除术是其非转移性病例的唯一根治性手段。自1913年Franz Torek首次成功实施该手术以来,术式不断演进,1996年Alfred Cuschieri报道的微创食管切除术(MIE)及2003年出现的机器人辅助微创食管切除术(RAMIE)显著提升了手术精度和患者预后。RAMIE更以其三维可视化、器械全关节活动度、震颤过滤和动作缩放等优势,便于在狭窄术野中进行精细操作。然而,MIE或RAMIE仍面临挑战,尤其在术者经验不足或术野因出血、烟雾干扰时,解剖结构识别困难可能增加手术风险。随着手术数字化和视频处理技术的发展,人工智能(AI)作为一项革命性工具,在提升食管手术精准性与安全性方面展现出巨大潜力。AI涵盖机器学习(ML)、深度学习(DL)等多种数据处理机制,能够模拟人类智能进行学习、推理和复杂决策。在手术室中,AI有望通过实时决策辅助、关键结构识别来增强手术精度和患者安全。尽管AI在胆囊切除术等高容量手术中应用广泛,但在食管切除术等复杂低容量手术中的探索仍处于起步阶段。本系统性综述旨在总结并分析现有关于AI在食管手术中应用的文献,重点关注解剖结构识别、器械检测和手术阶段识别三大核心领域。
方法
本综述严格遵循PRISMA(系统评价和荟萃分析优先报告条目)指南进行。文献检索在Medline和Web of Science数据库中进行,时间范围为2019年1月至2025年6月,以涵盖AI技术(特别是深度学习和视觉数据分析)最新进展。检索策略结合相关医学主题词(MeSH),初步获得7063篇文章,经去重后剩余6021篇。由两名评审员独立进行标题、摘要筛选及数据提取,分歧由第三位评审员仲裁。纳入标准聚焦于AI在食管手术中用于解剖结构识别、手术阶段检测、视频分析等计算机辅助方法的研究,排除侧重于术前术后风险预测、诊断或动物模型的研究。最终,仅有6项研究符合纳入标准。采用ROBINS-I V2(非随机干预研究偏倚风险评估工具第2版)对纳入研究进行偏倚风险评估,并使用robvis工具可视化。总体而言,纳入研究存在中度偏倚风险,主要涉及混杂因素信息有限、参与者选择、缺失数据处理以及结局测量和报告方面。
AI在此综述中的语境
本文涉及的AI术语包括:人工智能(AI)指模拟人类智能的机器;机器学习(ML)是AI的子集,利用算法从数据中学习并预测;深度学习(DL)是ML的进一步子集,使用多层神经网络建模复杂数据模式;卷积神经网络(CNN)是专为图像处理设计的DL模型;迁移学习(TL)涉及在相关问题中重用预训练模型以提高学习效率和准确性;主动学习(AL)是一种ML技术,模型选择最具信息量的数据点进行标注以提升训练效率。
研究目的
本研究主要目的是分析现有关于AI在食管切除术中应用的文献,重点关注研究设计、标注工作量和AI实施情况。其次,评估该技术的潜在未来应用及其更广泛的适用领域。
结果
纳入的6项研究均探讨了AI在MIE或RAMIE中的应用,核心用例包括解剖结构识别、器械识别和阶段识别。AI模型多为深度学习架构,如CNN、贝叶斯神经网络和时间卷积网络(TCN)。所有研究均将标注作为训练AI模型的关键预处理步骤,但策略各异。
- •Brandenburg等(2023) 分析26个RAMIE视频,采用贝叶斯ResNet18模型检测胃管、奇静脉及手术器械等“手术组学特征”。他们引入主动学习(AL)策略,与等距采样(EQS)相比,AL能选择更具信息量的帧,尤其对常见器械识别效果更佳(F1分数0.80 ± 0.17),减少了标注工作量。
- •Den Boer等(2023) 使用类似U-Net架构的语义分割模型(编码器为EfficientNet-B0)实时识别奇静脉、腔静脉、主动脉和右肺。他们在ImageNet和胃肠专用数据集GastroNet上预训练模型,显著提升了分割性能(p < 0.05),推理速度达39帧/秒,满足实时需求。
- •Eckhoff等(2023) 开发了结合CNN和长短期记忆网络(LSTM)的TEsoNet模型,用于Ivor-Lewis(IL)食管切除术腹腔镜阶段识别。他们利用大量袖状胃切除术数据(80个视频)进行预训练,再迁移到小样本食管切除术数据(40个视频),体现了迁移学习(TL)的价值。
- •Furube等(2024) 应用DeepLab v3 Plus模型对RAMIE视频中的左右喉返神经(RLN)、锁骨下动脉和气管进行语义分割。测试集交并比(IoU)为右RLN 0.40±0.26,左RLN 0.34±0.27,气管0.60±0.33。尽管结果有提升空间,但AI辅助下外科医生能更早、更准确地识别RLN。
- •Sato等(2022) 同样使用DeepLabv3+ CNN检测胸腔镜食管切除术中的RLN。其模型Dice系数达0.58,接近食管外科专家水平(0.62),并显著高于普通外科医生(0.47, p=0.0019)。
- •Takeuchi等(2022) 采用时间卷积网络(TeCNO)进行RAMIE手术阶段识别,将手术分为9个关键阶段,整体准确率达84%。该研究还探索了AI在评估手术熟练度方面的应用,发现早期与晚期手术组在特定阶段耗时存在显著差异。
四篇研究聚焦于此。Den Boer等对腔静脉分割的Dice分数中位数最高(0.79),Sato等和Furube等则重点挑战细小的RLN识别,AI表现接近或辅助提升了外科医生的识别能力。Brandenburg等对解剖结构(如胃管、奇静脉)的识别准确性相对较低。
仅Brandenburg等研究了手术器械识别,结果显示器械检测性能最高,尤其是永久性电钩(F1分数0.95)。AL策略在器械识别上显著优于EQS(p < 0.05)。
Eckhoff等和Takeuchi等研究了此领域。Takeuchi等模型准确率较高(84%),并能区分不同经验外科医生的阶段时长。Eckhoff等通过迁移学习,利用高容量手术数据辅助低容量食管切除术的阶段识别,准确率随训练数据量增加而提升。
六项纳入研究均存在中度偏倚风险。偏倚主要来源于混杂因素信息有限、参与者选择、缺失数据处理以及结局测量和报告的不一致。由于研究数量少,未进行发表偏倚的正式评估。
讨论
本综述揭示了AI在食管手术这一新兴领域的研究现状极为有限。初始检索获得大量文献,但仅六篇符合标准,凸显了该领域尚待深入探索。
研究性能因任务和数据集规模而异。器械识别(如电钩F1达0.95)表现最佳,而精细解剖结构如RLN的识别(IoU约0.34-0.40)仍具挑战性。AI在识别RLN等难点任务上可达到接近专家外科医生的水平。不同AI模型(CNN、U-Net、贝叶斯神经网络、TCN)被用于实时分析手术视频。然而,这些模型的实施需要大量计算资源和标注数据,这对于食管切除术等低容量手术构成重大挑战。主动学习(AL)和迁移学习(TL,如利用ImageNet、GastroNet预训练)是减少标注负担、提升模型性能的有效策略,尤其在数据有限时。
研究间存在显著异质性,包括手术方式(MIE vs. RAMIE)、标注者资质(医学生至专家)、性能指标(像素级Dice/IoU vs. 图像级准确率/F1分数)不一致,导致直接比较困难。偏倚风险主要表现为测量偏倚(“准确性”定义不一)、标注地面真实性可靠性问题以及选择偏倚(多为单中心数据)。未来需标准化数据集、标注协议和报告指标以增强可比性和可重复性。
推动AI在食管手术中的应用需多中心合作构建大规模多样化数据集(如TIGER-SQA研究),并采用分层团队标注(结合培训生、非专业标注员和专家验证)以提高效率和准确性。简化标注流程、结合半监督学习和主动学习至关重要。长期目标是实现AI驱动的术中安全辅助,如实时高亮关键结构或标记潜在错误。这需要将AI工具整合到复杂的手术室生态系统中,确保临床医生信任(通过可解释AI,XAI)并满足监管要求(如SaMD分类)。技术整合需遵循互操作性标准(如IEEE 11073 SDC),并采取分阶段实施策略,先从自动化手术记录等低风险高价值应用入手。
局限性
本综述存在若干局限性:纳入研究数量少(n=6),限制了普遍性和进行荟萃分析的可能性;多为小样本单中心数据集,存在过拟合和外部有效性疑虑;标注主观性可能影响地面真实性;研究间在手术设置、数据采样和标注策略上的差异使可重复性面临挑战;所有研究均报告阳性结果,可能存在发表偏倚;临床转化还面临监管审批、数据保护法和临床接受度等更广泛挑战。
结论
尽管AI在食管手术中仍处于早期阶段,但现有研究为其在解剖复杂手术中的应用提供了概念验证。AI在器械识别、特定解剖结构(如RLN)检测和手术阶段识别方面展现出潜力,尤其通过AL和TL策略应对数据有限的挑战。为了充分发挥AI的潜力,研究必须从小型、异质性、单中心努力转向协调一致的大规模多中心计划,采用标准化方案、稳健验证和清晰的临床整合策略。解决标注瓶颈、模型异构性、偏倚风险以及临床整合的实际障碍,对于实现AI在提升食管癌手术精准性和安全性方面的承诺至关重要。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号