面向支气管镜与插管自动化的上气道解剖标志数据集:推动机器人辅助呼吸诊疗新突破

《Scientific Data》:Upper Airway Anatomical Landmark Dataset for Automated Bronchoscopy and Intubation

【字体: 时间:2025年12月05日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对支气管镜检查和气管插管初始插入阶段自动化程度不足的挑战,开发并公开了上气道解剖标志(UAAL)数据集。该数据集包含来自82名患者的3,814张临床图像和2,746张体模图像,提供10,330个临床标注(含8类结构)和4,526个体模标注(含9类结构),涵盖从鼻腔到气管的完整上呼吸道解剖结构。通过提供多样化的解剖覆盖、临床数据、体模数据和公开可访问性,该数据集将显著促进支气管镜和插管自动化系统从实验室向临床应用转化。

  
在全球范围内,呼吸系统疾病每年影响超过5亿人,包括肺炎、流感等急性病症以及哮喘、慢性阻塞性肺疾病(COPD)等慢性疾病。这些疾病导致严重的健康和经济问题,迫切需要先进的诊断和治疗方法。在这一背景下,支气管镜检查和气管插管发挥着关键作用。然而,这两种具有挑战性的操作都需要高水平专业知识才能安全有效地进行,同时最大限度地减少患者不适和损伤风险。这种复杂性常常导致经验丰富的医生和初级医生在护理质量上存在差异。
为了应对这些挑战,研究人员探索了机器人系统来辅助这些操作。例如,AI协助手支气管镜机器人已被提出用于辅助支气管镜检查。这种人机协作方法使医生(包括经验有限者)能够在肺部检查中更有效地导航支气管镜。然而,此类系统主要关注气管支气管树内的导航,忽略了从体外到气管的初始插入阶段。同样,对于气管插管操作,也探索了不同的机器人辅助方法。一些机器人辅助系统主要关注机械结构,其可行性已通过远程操作得到验证。而其他研究则探索集成传感技术以实现自动化,尽管内窥镜导航仍存在挑战。因此,为了改进支气管镜和支气管镜引导插管的自动化,进一步研究应聚焦于初始插入过程。
常见的基于图像的内窥镜导航技术包括管腔居中、视觉里程计和窄带照明增强特征提取。它们的集成在结肠镜检查自动化中更为先进,这得益于下胃肠道的规则解剖结构。然而,由于上气道的复杂形态,在支气管镜检查自动化中性能有限。
为了克服这一限制,研究人员探索了用于解剖特征检测的深度学习方法。这些方法比传统技术在复杂解剖结构中具有更强的适应性,但需要高质量的训练数据集。然而,当前的上气道标志数据集仍然有限。现有的数据集在规模、类别多样性、临床数据可用性和公开访问性方面存在各种不足。高质量公开数据集的缺乏阻碍了用于自动化支气管镜检查和插管的稳健AI开发。
本研究引入的新型UAAL数据集具有以下特点:1. 多样化的解剖覆盖:该数据集标注了从外部鼻腔到气管的广泛解剖特征。2. 临床数据:包含从鼻咽镜检查过程中收集的3,814张临床图像,具有10,330个标注,包括8个类别的4,910个实例分割掩码和5,420个边界框。3. 补充性体模数据:为促进实验室的早期原型设计和测试,还包含使用支气管镜在商用气道体模模型中收集的2,746张图像,具有4,526个标注,包括9个类别的2,795个实例分割掩码和1,551个边界框。4. 公开发布:这一公共数据集允许更广泛的研究界访问并用于开发支气管镜检查和插管自动化系统。
研究方法主要包括数据收集、标注流程和质量验证。临床数据来自新加坡中央医院82名患者的鼻咽镜检查视频,涵盖20-70岁不同性别患者,体现了真实的解剖变异。体模数据则通过插管机器人系统在商用气道模型(泰桂医疗TG-J50)上采集。标注过程由耳鼻喉(ENT)专家制定指南,AI研究人员使用CVAT工具执行,采用边界框标注大体结构(如鼻子、通道),实例分割掩码标注精细结构(如鼻孔、声带)。所有标注经11名ENT专家审查确保准确性。数据集按视频级别划分为训练集和验证集,并以COCO格式发布。
数据记录
数据集在Figshare仓库公开可用,包含"coco_ins_phantom"(UAAL-体模数据集)、"coco_ins_clinical"(UAAL-临床数据集)和"annotation_visualization"样本。每个数据集包含"train2017"和"val2017"文件夹(分别存放训练集和验证集的PNG格式源图像)以及"annotations"文件夹(存放训练和验证集的JSON格式标注文件)。
技术验证
数据统计分析显示,数据集标注类别分布均衡,覆盖了从鼻孔到气管的完整上呼吸道结构。对类别间混淆度的评估发现,左右鼻孔以及左右声带是跨数据集最常混淆的解剖结构对,其他类别显示出相对较低的交叉混淆。注释尺寸分析表明,大多数注释对应于中型和大型解剖结构。
使用最先进(SOTA)模型进行基准测试表明,在体模数据集上,RTMDet-Ins-s在检测方面达到最佳mAPbox性能(40.6%),在分割方面达到最佳mAPmask性能(39.7%)。在临床数据集上,GFL达到最佳mAPbox性能,而PointRend达到最佳mAPmask性能。由于临床数据集比体模数据集具有更复杂的数据特征和更大的检测环境变化,所有模型的准确率均有所下降,这表明临床数据集是一个更接近真实插管场景的具有挑战性的数据集。
本研究构建的UAAL数据集通过提供详细、高质量且公开可用的上气道解剖标志标注,解决了支气管镜检查和气管插管自动化研究领域的关键瓶颈。该数据集独特的价值在于其全面的解剖覆盖(从鼻腔到气管)、真实的临床数据与可重复的体模数据相结合、严格的标注质量控制和公开可访问性。技术验证结果表明,SOTA模型在该数据集上能够达到与通用数据集(如COCO)相当的性能,证实了其高质量和有效性。这一资源将极大地促进基于视觉伺服的自主导航算法开发,推动支气管镜和插管自动化系统从实验室研究向实际临床应用转化,最终有助于提高呼吸系统疾病诊疗的标准化和可及性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号