Renji食管内镜黏膜下剥离视频数据集:首个公开的ESD手术阶段标注资源推动AI辅助内镜技术发展

《Scientific Data》:Renji endoscopic submucosal dissection video data set for Esophagus

【字体: 时间:2025年12月11日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对食管内镜黏膜下剥离(ESD)手术阶段识别缺乏公开标注数据集的问题,开发了包含25个完整手术视频、141,909帧精细标注的Renji食管ESD视频数据集。该数据集首次公开提供ESD八个手术阶段的专业标注,通过三级验证确保标注质量(Cohen's-Kappa>0.95),为AI辅助手术阶段识别、外科教育培训和术后分析建立了重要基准,相关数据已在Figshare平台开源共享。

  
在消化道早癌治疗领域,内镜黏膜下剥离术(Endoscopic Submucosal Dissection, ESD)作为微创治疗技术,已成为食管鳞状上皮 dysplasia(异型增生)/carcinoma(癌)m1-m2级别和高级别上皮内瘤变/腺癌m1-SM1级别的首选治疗方案。与传统外科手术相比,ESD不仅能够实现根治性切除,还具有创伤小、术后生活质量高等优势。然而,这项技术的学习曲线极为陡峭,对内镜医师的操作技能和实时判断能力提出了极高要求。当前外科培训主要依靠动物模型过渡到临床实践,但专家指导资源有限,特别是在西方国家的初学医师面临更多挑战。
更为关键的是,人工智能技术在计算机辅助手术干预领域展现出巨大潜力,能够为外科医师提供实时指导和术后分析支持。但高质量AI模型的开发严重依赖于精心标注的大型数据集。目前食管ESD领域存在一个明显的研究空白:虽然已有研究报道了基于深度学习的手术阶段识别系统(准确率超过85%),但这些研究所依赖的视频数据集均未公开,且阶段分类标准存在重要缺失,特别是缺乏术前放大内镜结合染色观察、术中牵引操作和术后止血管理等关键环节的标注信息。这种数据资源的匮乏严重制约了AI技术在ESD领域的应用和发展。
针对这一迫切需求,由上海交通大学医学院附属仁济医院消化内科李啸波教授团队领衔的研究小组在《Scientific Data》期刊上发表了题为"Renji endoscopic submucosal dissection video data set for Esophagus"的重要研究成果。该研究首次建立了面向食管ESD手术的公开视频数据集,包含了25个完整手术视频和141,909个精细标注的手术帧,为计算机辅助手术阶段识别提供了宝贵的基准资源。
研究团队采用系统化的数据采集和处理方法,所有手术视频均来自仁济医院内镜中心2024年5月至10月期间进行的连续食管ESD手术。使用Olympus CV-260/290内镜系统配合IMH-200图像处理单元进行录制,视频分辨率为1920x1080像素,帧率为50fps。为确保数据质量和技术一致性,所有手术均由具有15年以上ESD经验、完成超过5000例ESD手术的资深内镜专家李啸波主任医师操作。视频采集后经过专业编辑处理,去除了可能包含患者隐私信息和非手术相关内容,并对敏感信息进行严格脱敏处理。
在数据标注方面,研究团队建立了系统化的ESD手术阶段分类框架,将整个手术流程划分为8个明确阶段:准备阶段(Preparation)、病灶评估阶段(Estimation)、标记阶段(Marking)、注射阶段(Injection)、切开阶段(Incision)、ESD剥离阶段(ESD)、血管处理阶段(Vessel treatment)和夹闭阶段(Clips)。每个阶段都有严格的操作定义和起始-结束帧判定标准。考虑到视频数据量庞大,研究团队将视频降采样至1fps,即每秒提取第一帧进行标注,确保每个提取的帧都被精确分配到对应的手术阶段。
标注质量验证采用三级流程确保可靠性。首先由两名未参与手术的临床数据专家对随机选择的视频序列进行独立标注,通过Cohen's-Kappa统计分析显示标注者间一致性系数分别达到0.955和0.959(p<0.001),表明分类框架应用具有极高的可靠性。完成所有标注后,再由两名资深内镜专家(李啸波和张青伟)分别审核所有标注内容,对存在分歧的标注通过讨论达成共识并直接修正,确保整个数据集的标注准确性和一致性。
数据集特征
该数据集包含25个独立手术视频及其相应的阶段分类标签,来自同等数量的临床病例。患者平均年龄为60.35岁(标准差=9.02),人口学分布包括10名女性和15名男性,均为中国国籍。每个病例都配有详细的临床信息,包括患者 demographics(人口统计学特征)、术前内镜病理结果、术中内镜形态学表现、根据Inoue分类系统的放大内镜窄带成像(ME-NBI)分类,以及详细的术后病理学发现。
数据记录与可及性
完整的数据集以压缩包形式在Figshare存储库公开可用,包含原始25个内镜视频和141,909个阶段标记的连续帧。针对每个手术视频中的各个阶段,文本标注文件记录了精确的起始和终止帧信息。为便于访问和验证,数据集被重新组织为25个独立的压缩文件,每个文件代表一个可独立下载的临床病例。每个病例特定的压缩文件包含未修改的内镜视频(.mp4格式)、相关的阶段识别文档(.txt格式)和详细的器械规格文档(.doc格式)。此外,所有病例的全面临床信息作为独立文件(.xls格式)也可从Figshare存储库单独下载。
技术验证
数据集的技术验证主要体现在标注质量的严格控制和统计验证上。通过三级验证流程,特别是标注者间一致性分析显示出的高Kappa系数(>0.95),证明了标注框架的可靠性和标注结果的准确性。两位资深内镜专家的最终审核进一步确保了标注内容与临床实践的一致性,为后续AI模型的训练和验证提供了高质量的基础数据。
数据集局限性
研究团队也坦诚指出了数据集的局限性,主要是单中心、单操作者的设计特点。所有手术均由同一位经验丰富的内镜医师完成,这种标准化设计虽然有利于保证技术一致性,但可能限制了模型对不同操作者风格和技术方法的泛化能力。此外,统一的设备规格(包括特定的内镜器械和照明设置)也限制了采集参数的多样性。研究团队表示后续计划将扩大数据库,纳入多操作者贡献,并与不同的临床中心建立机构合作关系,以增强数据集的多样性和代表性。
这项研究的重要意义在于首次提供了专门针对食管ESD手术的公开视频数据集,填补了该领域高质量标注数据的空白。随着人工智能技术在医疗领域的快速发展,高质量数据集已成为推动技术创新的关键基础设施。Renji食管ESD数据集的发布将为计算机辅助手术阶段识别、外科医师培训、手术质量评估和术后分析提供重要资源,有望加速AI技术在内镜手术领域的实际应用。特别是在外科教育方面,这一数据集可用于开发模拟训练系统,帮助初学者更快掌握ESD技术的复杂操作流程,缩短学习曲线。对于临床实践,基于这一数据集开发的AI模型能够为内镜医师提供实时指导,识别潜在并发症,提高手术安全性和治疗效果。
作为食管ESD领域首个公开的视频数据集,Renji数据集不仅为后续研究建立了重要基准,也为多中心合作和数据标准化奠定了基础。研究团队的数据采集、标注和质量控制方法也为类似医疗视频数据集的构建提供了可借鉴的范例。随着更多研究团队利用这一资源开展创新研究,有望推动内镜手术AI技术从实验室研究向临床实际应用的转化,最终惠及更多患者。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号