AI驱动内镜下息肉精准测量数据集Polyp-Size的构建与验证:推动结直肠癌早期诊疗新策略

【字体: 时间:2025年06月01日 来源:Scientific Data 5.8

编辑推荐:

  针对临床内镜下息肉尺寸评估主观性强、误差大的问题,上海交通大学医学院团队开发了首个高精度内镜视频数据集Polyp-Size。该研究通过标准化采集42例白光结肠镜视频,结合术后游标卡尺亚毫米级测量验证,提供巴黎分型、解剖位置等多维度临床数据。技术验证显示AI模型可实现65%的5mm阈值分类准确率,为AI辅助息肉精准测量奠定数据基础,对优化结直肠癌筛查策略具有重要意义。

  

在结直肠癌(CRC)防治领域,息肉尺寸评估一直是临床决策的关键痛点。现有视觉估测方法存在高达30%的误差,常导致过度治疗或漏诊风险。这种不确定性源于内镜放大畸变、观察者间变异等多重因素,而传统数据集多聚焦于息肉检测而非尺寸测量,缺乏标准化验证数据。上海交通大学医学院附属仁济医院消化内镜中心联合生物医学工程学院,历时5个月收集了42例高分辨率白光结肠镜视频,创新性地采用术后游标卡尺测量(精度0.01mm)作为金标准,构建了首个专注于息肉尺寸评估的AI数据集Polyp-Size。

研究团队采用多学科协作模式,通过严格伦理审查(KY2023-002-B)采集患者数据。使用Olympus CV-290系统录制视频后,由两名10年以上经验的内镜专家独立筛选符合质量标准的视频(Cohen's Kappa=0.89)。数据处理包含三个关键步骤:视频标准化(去除左侧信息面板、统一为1000×1170分辨率)、多维度元数据标注(巴黎分类、解剖位置分10段、病理亚型),以及三重测量验证(ICC=0.987)。技术验证阶段创新性地引入深度估计模型ZoeN生成深度图,结合ResNet50等经典网络进行5mm阈值分类任务。

研究结果主要体现在四个方面:
背景与摘要:首次系统梳理了现有12个息肉数据集的局限性,指出仅3个含尺寸信息但精度不足。Polyp-Size通过亚毫米级物理测量填补该空白,视频平均时长9.76秒,覆盖2.80-11.74mm息肉尺寸范围。

方法学创新:建立双盲视频筛选流程,排除22例不合格视频(占比34.4%)。元数据包含独特的三重校验机制,巴黎分类、解剖定位等关键参数达成100%专家共识。

技术验证:五折交叉验证显示,DenseNet169模型取得最佳性能(AUC 0.691),较基线模型提升14.6%。深度图辅助使特异性达71.2%,证实数据支持基础AI开发。

应用前景:数据集首次实现息肉尺寸与NBI(窄带成像)、放大内镜等模态数据的解耦,为开发专用深度估计算法提供纯净白光数据。临床关联分析发现>60岁患者大息肉比例降低8.3%,提示年龄相关尺寸差异。

讨论部分强调了三重价值:临床层面,5mm临界值的准确判别可优化"切除即弃"策略;技术层面,标准化视频处理流程为多中心研究提供范本;科研层面,开放获取策略促进全球协作。局限性包括单中心样本偏倚(东亚人群为主)和深度估计误差,未来计划整合3D重建技术提升精度。该成果发表于《Scientific Data》时被列为编辑推荐,其创新性体现在:首次将术后物理测量与内镜影像直接关联,突破传统依赖虚拟标尺的局限;建立视频级而非图像级的尺寸标注标准;开发配套预处理代码降低使用门槛。

这项研究为CRC预防提供了新工具,其意义不仅在于数据集本身,更开创了"设备无关"的息肉测量新范式。通过将临床金标准引入AI训练,有望解决内镜放大畸变等固有难题,最终推动从主观估测到客观计量的范式转变。研究团队呼吁全球同行参与多中心验证,共同完善这一精准医疗基础设施。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号