综述:人工智能在结肠镜检查中应用的研究进展

《Gastroenterology & Endoscopy》:Research progress on the application of artificial intelligence in colonoscopy

【字体: 时间:2025年11月04日 来源:Gastroenterology & Endoscopy

编辑推荐:

  本文系统综述了人工智能(AI)在结肠镜检查中的应用进展,涵盖肠道准备评估、计算机辅助质控(CAQ)、息肉检测(CADe)与诊断(CADx)、早期结直肠癌浸润深度预测及炎症性肠病(IBD)管理等方向。AI技术通过深度学习模型(如CNN)显著提升腺瘤检出率(ADR)、减少漏诊,并推动内镜操作标准化与智能化发展,为结直肠疾病早诊早治提供新策略。

  

背景

结直肠癌(CRC)是全球第三大常见恶性肿瘤和第二大癌症相关死因,约占所有癌症病例的10%。随着人口老龄化和生活方式改变,其发病率和死亡率持续上升,尤其在包括中国在内的发展中国家。结肠镜检查作为CRC筛查和早期诊断的主要手段,通过发现并切除腺瘤性息肉等癌前病变,可显著降低CRC的发病率和死亡率。腺瘤检出率(ADR)是评估结肠镜质量的关键指标,研究表明,ADR每提高1%,CRC风险降低3%。然而,传统结肠镜检查存在漏诊率高(约26%的腺瘤可能被遗漏)和操作者差异大等局限性,主要原因包括肠道准备不充分、内镜技术差异、黏膜暴露不足以及内镜医师的主观局限性。
人工智能(AI)作为前沿技术,在医学影像分析中展现出巨大潜力,特别是深度学习分支中的卷积神经网络(CNN),能够从大量数据中自动学习特征,识别复杂空间模式和细微图像特征。在结肠镜领域,AI主要应用于计算机辅助检测(CADe)、计算机辅助诊断(CADx)和计算机辅助质控(CAQ),旨在提高诊断准确性、操作质量和治疗效率。

人工智能在结肠镜检查中的应用

1. 结肠镜质量与工作流程优化的基础AI应用

1.1. 肠道准备与评估
充分的肠道准备是有效检出腺瘤和预防CRC的前提。患者自我评估常因主观性和教育不足而不可靠。研究显示,AI可提升评估准确性。例如,Lu等人的随机对照试验比较患者自我评估与AI评估,发现AI组在右结肠的波士顿肠道准备量表(BBPS)评分更高。Zhu等人开发的AI智能手机应用,通过分析马桶中粪便照片预测准备质量,准确率达95.15%,临床试验中AI辅助组肠道准备充分率、BBPS总分及患者依从性均显著优于对照组。AI有潜力替代主观患者评估,提升术前准备效果。
1.2. 计算机辅助质控评估(CAQ)
结肠镜质控涉及盲区率、退镜时间(≥6分钟)、ADR(≥25%)等核心指标。AI系统可实时监测退镜速度、黏膜皱襞检查完整性,并提示盲区。例如,ENDOANGEL系统在人机竞赛中准确率达93.33%,优于内镜医师;其衍生的自动BBPS评分(e-BBPS)与ADR呈负相关。Colometer软件能实时评估图像清晰度、退镜速度和肠道准备。Gong等人的随机对照试验显示,AI辅助显著提高ADR。Liu等人开发的皱襞检查质量(FEQ)评估系统与专家评估、ADR和退镜时间强相关,尤其对ADR<25%的医师改善显著。此外,AI可识别阑尾开口作为盲肠插管标志(准确率>95%),间接提升腺瘤检出。Yao等人的综合质控系统整合医疗记录、内镜清洗和病理数据,自动评估多项指标,前端展示结果,使用组关键指标显著改善。
1.3. 结肠镜报告生成支持系统
准确、标准化的报告对质控至关重要。AI可自动记录关键参数(如息肉检测、盲肠插管时间),但尚不能生成完整报告。富士胶片的AR-C1系统通过脚踏开关记录病变位置和切除技术,但尺寸等细节仍需手动输入。AI在息肉尺寸估算(如直径≤5 mm息肉准确率93.3%)方面与经验医师相当。未来需结合大语言模型和特定数据集,实现全自动报告生成。

2. AI辅助结直肠息肉的检测、表征与管理

2.1. 结肠镜息肉检测(CADe)
CADe系统通过实时分析视频流,高亮可疑病变,减少小息肉或疲劳时的漏诊。早期研究基于特征提取(如Karkanis对比息肉与周围黏膜),但易受光照影响。Fernández-Esparrach利用边界特征预测息肉,灵敏度70.4%。Tajbakhsh引入上下文信息过滤非息肉结构,提升鲁棒性。深度学习带来突破:Urban等人用CNN处理2000余例患者数据,实时处理单帧仅10毫秒,曲线下面积(AUC)达0.991。多项随机对照试验证实CADe提高ADR和每结肠镜腺瘤数(APC),但增加非肿瘤性息肉切除。商用系统(如GI Genius、CADDIE、CAD-EYE)已获欧美批准,应用于临床。
2.2. 结肠镜息肉表征(CADx)
CADx旨在实时光学诊断,区分肿瘤与非肿瘤性息肉,支持“留而不切”或“切而弃之”策略。成像模态包括白光内镜、放大窄带成像(NBI)、染色内镜、细胞内镜等。Tischendorf最早用机器学习基于血管模式区分肿瘤性,后续模型性能提升。Kominami前瞻性研究显示CADx灵敏度93.0%、特异度93.3%,与专家诊断一致性达97.5%。近年系统对≤5 mm息肉阴性预测值(NPV)>90%,满足PIVI倡议阈值。FocusU2Net等模型兼顾分割精度和实时性,结合可解释AI技术提升透明度。但CADx仍受外部成像变异性和模型“黑箱”效应限制。
2.3. AI辅助息肉管理策略
针对≤5 mm低风险息肉,PIVI提出“留而不切”(要求NPV≥90%)和“切而弃之”(要求光学与病理诊断一致性≥90%)。Hassan研究显示CADx对直肠乙状结肠微小病变NPV达97.6%,可减少44.4%切除。但Barua多中心试验未发现CADx优于标准光学诊断。Meta分析表明CADx在“留而不切”策略中无显著获益或危害。Rondonotti评估CAD-EYE支持“切而弃之”,但效果依赖医师经验。当前证据未明确CADx在常规管理中的优势,需进一步提升诊断准确性和实时性。

3. AI辅助早期结直肠癌浸润深度预测

CADx应用于预测CRC浸润深度,辅助内镜治疗决策。Tokunaga基于白光内镜(WLC)图像的系统总体准确率90.3%,但对深部黏膜下浸润(T1b)准确率仅51.2%。Luo的AI增强注意力引导WLC系统区分非浸润/浅浸润(Tis/T1a)与深浸润/进展期(T1b-T3)准确率91.1%,但仅区分T1a与T1b时降至68.3%。Lu等人的Endo-CRC系统整合WLC和图像增强内镜(IEE),对早期CRC准确率93.78%。Yao的多模态深度学习结直肠癌浸润计算(CCIC)系统诊断准确率与专家相当,辅助初级医师准确率从75.4%提升至85.3%。Shimizu的CNN模型可区分低级别异型增生(LGD)、高级别异型增生/黏膜癌(HGD)、浅表黏膜下浸润(SMs)和深部黏膜下浸润(SMd),各类别准确率0.964–0.992。预测早期CRC浸润深度仍具挑战,需前瞻性研究验证。

4. AI在炎症性肠病综合管理中的应用

4.1. IBD诊断与鉴别诊断
AI有助于IBD与感染性、缺血性肠炎等鉴别。Guimar?es的CNN模型区分IBD与感染性、缺血性结肠炎性能中等,但基于临床参数的梯度提升决策树(GBDT)优于CNN和专家。Kim的CNN可区分贝赫切特病、克罗恩病(CD)和肠结核。Luo的多类别上下文分类(MCC)模型能准确区分CD、溃疡性结肠炎(UC)、肠结核(ITB)和缺血性结肠炎(IC),视频级模型平衡准确率0.808,与专家无显著差异。多数研究为回顾性,需前瞻性验证。
4.2. 溃疡性结肠炎(UC)
疾病活动度评估:当前梅奥内镜评分(MES)和UC内镜严重指数(UCEIS)存在主观差异。AI可自动化评估。Takennaka模型评估内镜和组织学活动度(UCEIS和Geboes评分)准确率分别为90%和93%。Gottlieb团队深度学习模型用视频依据MES/UCEIS评分,加权Kappa值0.844,媲美专家(0.855)。Fan的节段评估系统将结肠分5区多亚段,彩色编码显示活动度,MES评分与医师相当,UCEIS子项(血管模式、出血、糜烂/溃疡)准确率77.7%-90.7%。Meta分析证实深度学习算法评估内镜缓解潜力大。
UC相关异型增生检测:长期UC患者结直肠癌风险增加。Noguchi的CNN模型通过HE切片预测p53免疫组化阳性,性能高,为监测提供替代。Curtius基于临床病理特征的Cox回归模型有效分层风险,指导监测或预防性结肠切除术。
4.3. 克罗恩病(CD)疾病严重程度评估
CD内镜评分因溃疡形态异质性和病变分布不均而困难。Cai评估计算机视觉内镜(CVE)客观量化黏膜损伤,溃疡分割模型与医师标注相当,CVE测量与CD简化内镜评分(SES-CD)强相关,且能区分临床缓解状态,效应量大于SES-CD。AI在CD胶囊内镜应用较多,内镜成像研究有限,需进一步探索。

讨论

当前AI系统在结肠镜中的局限性

CADe虽提高ADR,但延长退镜时间、增加非肿瘤性息肉切除,可能增加患者和医疗负担。随机对照试验(RCT)显示CADe改善ADR,但非随机研究(如Patel Meta分析)未发现显著改善,提示研究设计影响结果评估。前瞻性研究效应量大于回顾性,操作者行为与系统交互是关键因素,但缺乏标准化评估指南。CADx尚不足以可靠支持“切而弃之”或“留而不切”策略,未显著提升医师诊断信心。其效用取决于影响决策的能力,尤其特定形态分类。技术上限受外部因素(光照、息肉形态、肠道准备)和模型“黑箱”效应影响。

胃肠道内镜AI的未来方向

未来研究应超越ADR等指标,关注患者中心结局(如癌症预防、减少不必要干预)。需由经验内镜医师主导,设计贴合临床的实用试验。优化人机交互,使AI成为动态协作工具,提供实时可解释反馈。开发可解释AI界面,可视化诊断特征(如病变形态、腺管结构、血管模式),提升信任度。伦理和隐私是主要障碍,需合规数据保护。联邦学习等技术在无需直接数据共享下协同建模,平衡创新与隐私。需建立透明数据治理、患者知情同意和伦理监督。跨学科合作(临床、计算机科学、政策制定、伦理协会、数据库工程)是释放AI潜力关键。

结论

近年来,AI在消化内镜领域取得突破。基于深度学习的CADe和CADx系统广泛应用于CRC和腺瘤的自动检测与诊断,显著提高ADR、减少漏诊、提升结肠镜整体质量。AI还辅助内镜操作质控、肠道准备评估和退镜流程优化,降低操作者差异。但当前应用存在局限:多数系统基于单中心或有限数据集,泛化性不足;对复杂病变和特殊息肉识别准确性待提升;受图像质量、工作流程和数据标准化限制。临床推广前需多中心验证。未来AI发展应优先大规模数据共享和协同建模,拓展在早癌筛查、预后预测和个体化治疗中的应用。加强AI与内镜医师协作可实现优势互补,优化全流程质控。随着技术与临床需求深度融合,AI有望进一步提升诊断效率和品质,支持胃肠道疾病早发现和精准管理。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号