云端人工智能实时检测结直肠肿瘤的突破性随机对照试验(EAGLE研究):一项多中心研究

《npj Digital Medicine》:A novel cloud-based artificial intelligence for real-time detection of colorectal neoplasia – a randomized controlled trial (EAGLE)

【字体: 时间:2025年12月27日 来源:npj Digital Medicine 15.1

编辑推荐:

  本研究针对传统结直肠息肉计算机辅助检测(CADe)系统硬件依赖性强、升级困难且对大型息肉和无蒂锯齿状病变(SSLs)检测能力不足的局限,开发并评估了新型云端CADe系统(CADDIE)。这项多中心随机对照试验(RCT)表明,该云端系统能实时(平均延迟59.4ms)有效提升腺瘤检出率(ADR提升7.3%),并显著改善临床意义重大的大息肉(≥10mm)和SSLs的检测,为AI在消化内镜领域的实时云端部署提供了可行性验证。

  
结直肠癌(CRC)是全球范围内第三大常见癌症和第二大癌症相关死亡原因。结肠镜检查作为CRC筛查的金标准,能够检测并切除癌前病变,如腺瘤和无蒂锯齿状病变(SSLs)。然而,结肠镜检查并非万无一失,腺瘤的漏诊率高达26%,SSLs的漏诊率也达到27%。研究表明,息肉检测率与结肠镜检查后结直肠癌(PCCRC)的风险直接相关,漏诊主要源于粘膜可视化不充分以及对可见息肉的识别失败。
近年来,评估计算机辅助检测(CADe)系统以改善息肉检测的随机对照试验(RCT)日益增多。CADe的RCT荟萃分析证实了其改善息肉检测的能力,但关键局限性依然存在。现有的CADe系统主要提高了较小息肉(<10mm)的检测率,但在改善更具临床意义的大型息肉(≥10mm)和SSLs的检测方面效果有限。串联结肠镜检查的荟萃分析显示,大腺瘤的漏诊率为6%,这具有重要的临床意义,因为已知大尺寸息肉具有更高的恶变风险。SSLs由于其平坦的形态和细微的内镜特征而 notoriously 难以检测,并且与不成比例的高PCCRC风险相关。
传统息肉CADe系统和研究的一个关键局限是需要在医院的本地运行AI算法。这意味着需要本地的高性能计算机硬件,这可能成本高昂,尤其是在未来需要为算法升级硬件时。此外,软件更新可能复杂、耗时,并且需要技术人员现场操作。基于云端的人工智能(AI)系统代表了一种变革性的转变,能够实现实时、高性能计算而无需这些限制。边缘-云混合架构允许无缝的后端算法更新,为临床医生即时提供最新的AI模型,同时还提供了更好的可访问性和可扩展性。这种AI内镜的新范式转变至今尚未得到充分探索。
本研究评估了一种新型云原生CADe系统(‘CADDIE’)的临床疗效、安全性和技术可行性,该系统是使用富含临床显著息肉(大息肉和SSLs)的训练数据集开发的。
为了开展研究,研究人员采用了几项关键技术方法。研究设计为前瞻性、多中心、平行组随机对照试验(RCT),在四个欧洲国家的八个中心进行。研究人群为年龄≥40岁、计划进行筛查或监测结肠镜检查的患者,最终分析人群包括841名患者。患者被随机分配至CADDIE辅助结肠镜检查(CADe组)或标准结肠镜检查(SoC组)。主要疗效终点是每次结肠镜检查的腺瘤数(APC),主要安全终点是阳性符合率(PPA),即组织学确认为腺瘤、SSLs或近端大型(≥10mm)增生性息肉的切除比例。技术可行性通过分析整个检查过程中的云端网络延迟来评估。统计分析采用改良意向治疗(mITT)人群,使用广义线性混合模型(GLMM)比较终点。
结果
患者特征
最终分析的研究人群包括841名患者(CADe组417名,SoC组424名),平均年龄为58.5±9.3岁。两组在人口统计学、结肠镜检查指征、内镜模型和手术特征(包括镇静和肠道准备质量)方面均相似。
技术结果测量
整个研究的结肠镜检查总时间为31,151分钟。平均云端网络延迟为59.4毫秒(ms),99.6%的手术时间延迟低于100ms的实时使用阈值。只有一个手术的平均延迟超过了此阈值。
临床结果测量
主要终点显示,CADe组的APC显著高于SoC组(0.82 vs 0.62,比率1.33[95%CI 1.06-1.67], p=0.01)。在PPA方面,CADe组显示出非劣效性(53.9% vs 53.4%;差异0.5%[-5.0%, ∞]),表明不必要的切除没有增加。
在次要和探索性终点方面,CADe组的腺瘤检出率(ADR)显著更高(43.2% vs. 35.9%,差异7.3%[95%CI 0.7%-13.9%], p=0.03)。平均息肉检测指标也显著有利于CADe组,包括每次结肠镜检查的SSLs数(SSL-PC)(0.08 vs. 0.03;比率3.30[95% CI 1.41-7.57], p<0.01)、每次结肠镜检查的肿瘤性息肉数(NPPC)(0.91 vs. 0.66;比率1.39[95% CI 1.12-1.73], p<0.01)和每次结肠镜检查的息肉数(PPC)(1.41 vs. 1.06;比率1.35[95% CI 1.13-1.61], p=0.001)。
CADe组对大腺瘤(大APC 0.09 vs 0.04;比率1.93[95%CI 1.03-3.62], p=0.04)和大息肉(大PPC 0.12 vs 0.05;比率2.36[95%CI 1.33-4.17], p<0.01)的检测率也显著更高。在形态学方面,CADe组中非息肉样大息肉(38.0% vs 27.3%)和非息肉样大腺瘤(22.9% vs 15.8%)的比例高于SoC组。此外,CADe组的大型非息肉样PPC显著更高(比率3.34[95%CI 1.10,10.2], p=0.03)。
在所有息肉大小中,CADe组对息肉样(平均PPC 0.74 vs 0.57;比率1.33, p=0.02)和非息肉样(平均PPC 0.53 vs 0.40, 比率1.37, p=0.03)息肉的检测率均更高。近端腺瘤和近端息肉的检测率在CADe组也显著更高。
CADe组的总手术时间和结肠镜退镜时间(CWT)显著长一分钟,但在息肉阴性手术中两者时间相同。报告了5例不良事件(AE)(SoC组3例,CADe组2例),均与手术相关,与设备无关。
讨论
EAGLE研究首次评估了用于实时检测结直肠肿瘤的基于云端的CADe部署。研究表明,该云端系统在真实世界多样化测试环境中技术上是可行的,平均网络延迟低(59.4ms),且绝大部分时间(99.6%)低于100ms阈值,无需修改医院IT基础设施。云端部署具有诸多优势,包括能够持续提供最新的CADe算法、提高可访问性(降低对专业硬件的需求)以及为未来提高AI内镜的可持续性奠定基础。
除了证明基于云端的CADe工作流程的技术可行性外,研究还证明了该算法在大型内镜医师队列中对基于年龄的筛查和监测人群的疗效和安全性。与先前研究一致,研究达到了APC优效性和PPA非劣效性的共同主要终点。然而,本研究观察到了对大腺瘤、大息肉和SSLs检测率的独特提升,这些发现在先前的CADe算法RCT中很少得到证实。ADR增加7.3%的幅度与降低PCCRC风险相关。APC增加0.2(从0.62到0.82)也可能具有临床意义,尽管其与PCCRC的关系需要进一步研究。CADe系统有助于检测更具挑战性的大型非息肉样息肉,这可能是其改善大息肉检测的一个因素。SSLs检测率近三倍的提升尤其值得注意,因为先前的CADe荟萃分析并未显示SSL检测有显著增加。
研究优势包括多中心、多国家设计和大规模内镜医师队列。局限性包括未纳入低ADR(<25%)的内镜医师,患者招募限于基于年龄的筛查和监测指征,未评估对有症状或高风险(如FIT阳性)指征的影响,且研究仅使用了奥林巴斯的内镜设备。
结论
总之,实时云端AI内镜的出现代表了胃肠病科室访问计算机辅助系统方式的范式转变。它有望推动新一代AI系统用于疾病的检测、诊断和治疗;医生可以无缝访问最新的AI模型和针对新疾病领域的新产品,而不受遗留硬件或工程师现场维护的限制。本文展示了一项多国、多中心RCT,证明了实时基于云端的息肉CADe系统在内镜中的可行性、有效性和安全性。研究中的中心没有专业的IT设备或基础设施,表明实时云端内镜在标准医院和常规临床实践中具有应用潜力。此外,研究观察到使用CADe时,内镜医师在多项检测指标上的息肉检测率有所提高,尤其是对大腺瘤、大息肉和无蒂锯齿状病变的检测。这些发现表明,CADe系统可能有助于持续改善患者预后的努力。未来的研究方向包括开发新的AI训练方法以进一步增强特定病变类型的检测,探索优化训练数据集富集对CADe及其他计算机辅助系统性能的影响,以及评估算法在更广泛临床环境(如有症状患者、低ADR内镜医师)中的普适性和有效性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号