脊柱内镜手术器械分割开源数据集SEA:推动AI辅助精准脊柱微创手术发展
《Scientific Data》:Spine endoscopic atlas: an open-source dataset for surgical instrument segmentation
【字体:
大
中
小
】
时间:2025年10月03日
来源:Scientific Data 6.9
编辑推荐:
本研究针对脊柱内镜手术(ESS)中器械分割精度不足的问题,开发了首个基于真实手术场景的脊柱内镜图谱(SEA)数据集。该数据集包含48,510张图像和10,662个器械分割标注,涵盖6类常用手术器械。通过验证UNet、CaraNet、CENet、nnU-Net和YOLOv11x等5种深度学习模型,证明SEA能显著提升复杂场景下的分割精度(nnU-Net的Dice系数达0.9753),为智能手术辅助系统开发奠定数据基础。
在微创手术技术飞速发展的今天,脊柱内镜手术(Endoscopic Spine Surgery, ESS)凭借其创伤小、恢复快的优势,已成为治疗椎间盘突出、神经根受压等脊柱疾病的常用手段。然而,这项精细技术却面临着严峻的挑战——手术视野受限、器械操作空间狭窄,加上出血、气泡、组织遮挡等复杂因素,使得年轻医生需要经历漫长而陡峭的学习曲线才能掌握这项技术。更令人担忧的是,手术过程中器械定位不准可能引发硬膜外血肿等严重并发症,直接威胁患者安全。
随着人工智能(AI)技术在医疗领域的深入应用,开发能够实时辅助医生进行手术决策的智能系统,成为提升脊柱内镜手术安全性和精准性的关键突破口。而实现这一目标的首要步骤,就是让计算机能够准确识别和分割手术视野中的器械轮廓。遗憾的是,此前领域内缺乏专门针对脊柱内镜手术的公开图像数据集,严重制约了相关算法的发展。
为了解决这一瓶颈问题,由深圳市南山区人民医院疼痛科廖祥教授团队领衔的研究团队,在《Scientific Data》期刊上发布了首个基于真实脊柱内镜手术的器械分割数据集——脊柱内镜图谱(Spine Endoscopic Atlas, SEA)。该研究团队从两家医疗中心的119例患者手术视频中,系统提取了48,510张高质量图像,并由专业团队采用LabelMe和3D Slicer软件对10,662个器械实例进行了精细标注,创建了涵盖抓钳、双极电凝、钻头等6类常用器械的完整数据集。
研究团队特别关注了真实手术中的复杂场景,将图像分为"正常场景"和"困难场景"两大类。困难场景包括器械被血液遮挡、气泡干扰、曝光不足等多种挑战性情况,这些场景在实际手术中极为常见,但对算法的鲁棒性提出了更高要求。SEA数据集中困难场景图像占比较高,这一设计思路旨在训练出能够适应真实手术环境的更加强大的AI模型。
在技术方法层面,研究团队采用多中心回顾性数据收集策略,从2019年1月至2023年12月期间的手术视频中提取图像数据。通过严格的伦理审查(伦理批号:ky-2024-101601),确保所有数据均经过严格匿名化处理。标注过程采用双人独立标注与分级审核机制,使用Dice系数(DC)和交并比(IoU)进行标注一致性评估,最终标注一致性达到DC=0.9550,IoU=0.9166的高水平。数据集按手术部位(颈椎/腰椎)、工作通道大小(大通道/小通道)进行系统分类,为不同手术场景下的算法验证提供了丰富素材。
SEA数据集总计包含48,510张图像,其中37,848张未分类图像和10,662张带有分割掩模的标注图像。图像尺寸以1920×1080为主(45,822张),同时包含1280×720和720×576两种分辨率。数据集总容量达9.99GB,分割掩模采用NRRD格式存储,容量为0.08GB。器械类别分布呈现明显差异,抓钳(4,918张)和双极电凝(2,933张)图像数量最多,而剪刀(407张)和剥离器(241张)相对较少,这准确反映了不同器械在真实手术中的使用频率。
研究团队在SEA数据集上系统评估了五种主流分割模型的性能。将数据集按80%训练集、10%本地测试集(来自医疗中心1)、10%外部测试集(来自医疗中心2)的比例划分,确保了评估的严谨性。结果显示,nnU-Net模型表现最为出色,在本地测试集上Dice系数达到0.9753,IoU为0.9531;即使在外部测试集上,其Dice系数仍保持在0.9376,IoU为0.8966,展现了优异的泛化能力。
相比之下,U-Net、CaraNet和YOLOv11x模型在外部测试集上性能下降明显,特别是U-Net模型的Dice系数从0.9530降至0.6578,这凸显了单一中心数据训练模型的局限性。CENet模型在外部测试集上表现稳定(Dice=0.9098),表明其上下文编码机制能有效适应不同医疗中心的数据差异。
研究特别强调了脊柱内镜手术中的九类困难场景:气泡干扰、工作通道干扰、出血、曝光不足、过度曝光、骨屑干扰、器械占比过小、组织遮挡以及多重困难场景共存。这些场景对器械分割算法提出了严峻挑战,而SEA数据集通过大量包含这些复杂情况的图像,为开发鲁棒性强的算法提供了重要训练资源。
该研究的创新价值在于首次构建了专门针对脊柱内镜手术的器械分割数据集,填补了该领域公共数据资源的空白。SEA数据集不仅包含精细标注的分割掩模,还保留了大量的未标注图像,为半监督学习算法的发展提供了宝贵资源。通过利用未标注数据,研究人员可以开发出能够自动学习图像结构特征的模型,显著降低标注工作量,同时提升模型对多样化特征的识别能力。
从临床应用角度看,SEA数据集为智能手术辅助系统的开发奠定了坚实基础。基于该数据集训练的算法可用于实时器械跟踪、手术导航、操作动作识别等关键任务,有望显著降低脊柱内镜手术的学习难度,提高手术安全性。特别是在狭窄的解剖空间内维持空间感知、避免器械组织损伤等方面,AI辅助系统将发挥重要作用。
研究人员展望了未来的发展方向:计划与至少三家三甲医院合作,纳入更多样化的手术视频和临床数据;扩展器械类别至缝合装置、超声骨刀等新型设备;引入手术阶段标签以支持手术风险预测模型的开发。这些努力将进一步提升数据集的临床价值和适用范围。
脊柱内镜图谱数据集的发布标志着脊柱微创手术智能化进程迈出了关键一步。通过为AI算法开发提供高质量、多中心、覆盖复杂场景的训练数据,这一资源将加速智能手术辅助系统的创新,最终为全球范围内的脊柱疾病患者带来更安全、更精准的微创治疗选择。随着数据集的不断完善和算法的持续优化,人工智能有望成为脊柱外科医生得力的"数字助手",共同推动精准脊柱外科的发展新纪元。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号