编辑推荐:
为解决眼科影像深度学习依赖标记训练数据,且术中领域标注数据匮乏问题,研究人员开展 FOVEA 数据集相关研究。该数据集包含 40 例患者术前、术中视网膜影像及标注等。其有助于支持玻璃体视网膜手术,推动眼科手术智能化发展。
在眼科医学领域,手术前和手术中的影像对于疾病的诊断、定位以及手术过程的引导至关重要。传统上,术前影像的评估主要依赖临床医生和分级中心,但近年来,深度学习算法的崛起为眼科影像分析带来了新的机遇。深度学习算法有望减轻临床医生的工作负担、提高手术效果、提升患者满意度,还能利用多源数据完成临床专业人员难以处理的任务。然而,深度学习模型的性能高度依赖大量手动标记的数据集。尽管目前已有一些用于视网膜血管分割和视神经盘分割的公共数据集,如 STARE、DRIVE、CHASE_DB18 等,但这些数据集都仅基于术前彩色眼底摄影。在更为复杂多变的术中领域,相关研究进展缓慢,例如在术中构建血管图时,传统算法检测血管的噪声成为限制因素,而高质量的术中领域标注数据能够助力深度学习方法进行术中定位和分割,并作为验证基准。
在此背景下,来自伦敦国王学院(King’s College London)、谢菲尔德教学医院(Sheffield Teaching Hospitals)、伦敦大学学院眼科研究所(Institute of Ophthalmology, University College London)等机构的研究人员开展了一项重要研究,相关成果发表在《Scientific Data》上。他们创建了 FOVEA(Fundus images with Optic disc and retinal VEssel Annotations)数据集,这是首个包含高质量术前和术中视网膜眼底图像标注的数据集,有望为眼科手术的深度学习应用提供有力支持。
研究人员采用了一系列严谨的技术方法来构建该数据集。首先是数据采集(Acquisition),数据来源于 2017 年至 2021 年在英国伦敦 Moorfields 眼科医院接受标准治疗的成年患者,这些患者需进行扁平部玻璃体切除术。研究人员在获得患者知情同意后,采集了他们的术前彩色眼底摄影(CFP)图像和术中影像,其中 CFP 图像通过 Topcon 3D OCT - 1000 眼底相机获取,术中影像则借助 Zeiss Lumera 700 眼科显微镜及集成的 RESIGHT 眼底观察系统和 128D 镜头采集。其次是数据选择(Selection),为保证数据集质量,研究人员剔除了术前或术中眼底图像质量不佳,以及患有影响图像标注或不具代表性疾病(如脉络膜血症、近视性黄斑劈裂)的患者数据,并从术中显微镜记录中挑选出最合适的帧用于标注。然后是标注(Annotation),由两名临床研究人员依据特定协议,分别独立标注术前和术中视网膜眼底图像中的视神经盘和视网膜血管,标注在 iPad Pro 上借助压力敏感的 Apple Pencil(2 代)和 Procreate 软件完成。之后是处理(Processing),将标注数据从 Procreate 导出为 psd 文件,再转换为 png 文件,通过特定算法处理得到连续的二进制掩码,去除标注错误。最后对整个数据集进行广泛分析,从视觉和统计角度验证标注的一致性和质量。
在数据记录方面,FOVEA 数据集可从 figshare 下载,包含 601 个文件,如术前 RGB 彩色眼底图像、术中 RGB 彩色视频片段、原始标注、二进制标注掩码以及包含元数据的 json 文件,文件名遵循特定命名方案。
技术验证部分,研究人员对数据集进行了深入分析。在处理环节,将血管标注的骨架与阈值化后的掩码相结合的方法,既能有效连接血管树,又能去除误标注区域,统计结果显示,结合骨架后,孤立标注区域数量和平均大小显著减少。统计分析表明,术中数据标注的像素数明显少于术前,两名标注员标注的像素数存在差异,但在视网膜血管分割骨架总长度方面差异不大,还计算出了术前和术中图像的平均标注视网膜血管宽度,验证了标注在不同领域和类别中的一致性。此外,通过 Dice 分数和扩展 Cohen’s Kappa 系数评估标注员之间的一致性,结果显示视神经盘标注一致性高,而术中视网膜血管标注一致性较低,反映出术中标注的难度。
在使用说明中,研究人员指出,由于术中成像存在模糊、光照不足等问题,较小的视网膜血管分支难以区分,不同标注员可能存在分歧。数据集使用者可根据需求选择或组合标注数据,研究人员还提供了 Python 方法辅助处理。同时,研究人员也提醒使用者注意数据集存在的潜在偏差和局限性,如数据来源于特定医院和相对较小的患者群体。为展示数据集的价值,研究人员利用该数据集对 Segment Anything Model(SAM)进行微调,预测视网膜血管分割,结果表明在相同领域训练和测试性能更佳,Lovász - Softmax 损失函数在某些语义分割任务上表现更优,且利用数据集中的两个标注可提高模型性能。
研究结论表明,FOVEA 数据集为眼科手术相关的深度学习应用提供了宝贵资源。其意义在于,该数据集首次将高质量的术前和术中视网膜眼底图像标注相结合,有助于支持玻璃体视网膜手术,例如通过定位感兴趣点或注册额外成像模态辅助手术;还能促进增强现实技术在实际手术中的应用,为临床医生提供更丰富的手术环境。此外,研究结果也证实了即使是少量高质量的新领域标注数据,结合现代深度学习方法也能发挥强大作用,为后续眼科影像研究和手术技术的发展奠定了基础。不过,研究也存在一定的局限性,如数据集来源相对单一,未来研究可进一步扩大样本量,涵盖更多不同地区和患者群体的数据,以提高模型的泛化能力;同时,研究人员可探索更复杂的数据训练管道和超参数调整策略,进一步优化深度学习模型在眼科影像分析中的性能,推动眼科医学的发展。