编辑推荐:
为解决眼科 OCT 图像分析缺乏高质量标注数据集的问题,UCL 的研究人员开展 OCT5k 数据集相关研究。他们构建多疾病、多分级标注数据集,结果表明其能助力模型训练。推荐阅读,一起探索眼科研究新突破!
在眼科疾病研究领域,来自 UCL(University College London,伦敦大学学院) 眼科研究所的 Mustafa Arikan 等人,在《Scientific Data》期刊上发表了题为 “OCT5k: A dataset of multi-disease and multi-graded annotations for retinal layers” 的论文。这篇论文为眼科疾病的研究以及基于机器学习的视网膜图像分析算法的发展提供了重要的数据支持,在眼科医学领域有着不可忽视的意义。
研究背景
在眼科医学中,视网膜图像对于疾病的检测、病情进展跟踪以及治疗效果的监测至关重要。光学相干断层扫描(Optical Coherence Tomography,OCT)凭借其高分辨率和能提供视网膜详细图像的能力,在眼科领域得到了广泛应用。然而,尽管 OCT 技术和分析方法不断进步,但高质量的标注数据集的缺乏却严重阻碍了相关研究的发展。手动标注不仅效率低下,在经济上也难以大规模开展。特别是在年龄相关性黄斑变性(Age-related Macular Degeneration,AMD)和糖尿病性黄斑水肿(Diabetic Macular Edema,DME)等疾病的管理中,及时且精确的监测对患者的治疗结果影响重大,因此迫切需要自动化工具来充分利用 OCT 技术的敏感性进行疾病的诊断和监测。
此外,准确且稳健地分割 OCT 图像中的视网膜层对于视网膜图像的定量分析至关重要,这能确保分析结果可靠并有助于做出有意义的解释。虽然针对单一疾病的视网膜层图像可以通过较少的训练图像和标注实现自动分割,但要对更广泛的疾病进行视网膜层分割以实现更好的泛化,就需要更复杂的算法。因此,一个能提供多疾病、多分级标注的高质量视网膜 OCT 图像数据集对研究人员来说非常必要,它可以为复杂的自动眼科图像分析算法的开发提供有力支持。
关键技术方法
- 数据标注流程:研究人员使用的 OCT 图像数据集最初由 Rasti 等人收集且公开可用。从该数据集中选取了 60 个体积(volume)的图像,分别来自 AMD、DME 患者和健康个体,这些图像均经过专家评估,确保质量良好。标注过程基于日立开源语义分割编辑器搭建了定制化标注平台。为加快标注速度,先利用少量图像训练了一个模型来生成视网膜层分割掩模,标注人员在此基础上进行校正。标注人员主要标注 5 个视网膜层,包括内界膜(Internal limiting membrane,ILM)、外丛状层(Outer Plexiform Layer,OPL)、光感受器内外节层(Photoreceptor Inner Segment and Outer Segment Layers,IS-OS)、视网膜色素上皮内边界(Inner Boundary of Retinal Pigment Epithelium,IBRPE)和视网膜色素上皮外边界(Outer Boundary of Retinal Pigment Epithelium,OBRPE)。为减少偏差,同一体积的图像会被打乱后分配给不同标注人员。标注完成后,利用四分位数间距(interquartile range,IQR)检测异常值,并对标注结果进行三次迭代检查和校正,以提高标注质量。
- 标注可靠性评估:通过计算交并比(Intersection over Union,IoU)和层间平均距离这两个指标来评估不同标注人员之间标注结果的一致性。IoU 用于衡量两个分割掩模的相似性,层间平均距离则通过计算代表不同层的两条线之间的平均绝对差值来评估标注的准确性。这些指标有助于发现标注中的差异和问题,为模型开发提供参考。
- 目标检测标注:除了视网膜层标注,研究人员还对 566 张图像中的 9 种不同疾病生物标志物类别进行了边界框标注。这些标注由一组专家完成,每个专家负责不同的图像集,其中有一组 100 张图像由不同专家分别标注两次。对于不同的生物标志物,如地理萎缩(Geographic Atrophy)、玻璃膜疣(Drusen)等,都有明确的标注规范,例如地理萎缩的边界框需覆盖整个透照缺损区域,玻璃膜疣的标注要包含其峰值、Bruch 边界以及与视网膜色素上皮(Retinal Pigment Epithelium,RPE)连接的点等。
- 分割模型:为展示如何利用这些数据训练分割模型,研究人员选择了基于 U - Net 架构并以 EfficientNet 为骨干网络的模型。EfficientNet 通过复合系数缩放技术,能够更轻松地扩展深度学习模型,提高准确性和效率。使用该模型可以在不同图像分辨率下进行训练,并更易于适应不同的模态。
研究结果
- 数据集构成:该数据集包含 1672 次 OCT 扫描的像素级手动标注,涵盖了 AMD、DME 和健康三种类别,共标注了 5 个视网膜层边界。此外,还对 566 次扫描中的 9 类疾病生物标志物进行了 4698 个边界框标注。数据集可在 UCL 研究数据存储库获取,标注数据保存为三种格式:文本文件(每行对应扫描的一列数据)、灰度值图像文件(每个像素代表一个层)和 RGB 图像文件(每个像素的 RGB 值代表一个层)。同时,研究人员还提供了下载原始图像的脚本以及为模型训练准备图像和标注数据的脚本。
- 标注质量评估:通过计算 IoU 和层间平均距离评估标注质量。结果发现,不同类别视网膜图像在不同层的标注一致性存在差异。在整个数据集中,Background/ILM 和 OBRPE/Background 层的标注一致性较高,IoU 得分接近 1.0;而在 AMD 扫描中,IS-OS/IBRPE 和 IBRPE/OBRPE 层的标注一致性较低,IoU 得分分别约为 0.8 和 0.75;在 DME 扫描中,这两层的标注一致性更低,中位数接近 0.75。这表明在 DME 扫描中,标注 IS-OS/IBRPE 层尤其具有挑战性,而在 AMD 病例中,IBRPE/OBRPE 层的标注难度较大。综合使用这两个指标,经过三次迭代校正,确保了标注质量达到较高水平,适合用于训练和评估分割模型。
- 模型训练与应用:利用该数据集,研究人员展示了如何使用 U - Net + EfficientNet 模型进行视网膜层语义分割。这个数据集不仅可以用于训练和评估基于机器学习的视网膜层分割架构,还能用于分割关键的视网膜生物标志物,为各种分割和目标检测任务提供了基准数据集。研究人员可以基于此数据集进行模型训练,用于对新数据集进行预分割和初步标注,简化新疾病研究中的标注校正和验证过程。同时,借助数据集中的多标注人员标注数据,可以通过评估患病样本与健康对照之间的差异,量化疾病的严重程度和进展情况,为理解疾病影响和发展轨迹提供了更精细的指标。
研究结论与讨论
OCT5k 数据集的出现为眼科疾病研究和自动视网膜图像分析算法的发展带来了新的契机。该数据集具有多疾病、多分级标注的特点,涵盖了多种视网膜疾病和健康样本,为训练更复杂、更具泛化能力的机器学习模型提供了丰富的数据支持。通过严格的数据标注流程和质量控制,确保了标注数据的可靠性和高质量,这对于训练准确的模型至关重要。
在实际应用中,这个数据集可作为验证和比较自动视网膜图像分析算法的基准,帮助研究人员发现算法存在的问题和改进方向。通过对不同疾病类别进行针对性训练和测试,能够研究模型的泛化能力,探索提高模型在不同病理条件下性能的方法。此外,通过对比模型与标注人员之间的一致性,以及不同标注人员之间的一致性,可以评估模型的可靠性。
从更广泛的意义来看,公开可用的数据集结合深度学习等人工智能方法,具有改变眼科疾病研究和视网膜成像研究的巨大潜力。OCT5k 数据集为这一发展趋势提供了重要的数据基础,有望推动眼科医学领域的自动化诊断和监测技术的发展,提高眼科医疗服务的准确性和效率,为患者带来更好的医疗体验和治疗效果。未来,随着相关研究的不断深入,该数据集可能会在更多领域发挥重要作用,为眼科医学的进步做出更大的贡献。