编辑推荐:
在医学影像诊断中,OCT 图像病变标注数据匮乏,现有弱监督方法存在归因不精确、定位质量差的问题。研究人员开展了基于 OCT-CAE 的弱监督病变定位研究,实验表明该方法能有效分离图像潜在信息空间,性能卓越,为 OCT 诊断提供精准支持。
在医学领域,视网膜病变是严重威胁公众健康的一大难题,它是导致视力受损的重要原因。光谱域光学相干断层扫描(SD-OCT)成像技术的出现,为眼科医生获取视网膜扫描信息、提高诊断效率提供了有力支持。然而,随着人工智能(AI)和深度学习(DL)在医学影像计算机辅助诊断领域的广泛应用,问题也逐渐暴露出来。
传统的监督学习虽然能让 DL 模型有效区分患病和健康样本、分割病变区域,但它对大量标注数据的依赖成为了难以跨越的障碍。在医学图像领域,获取标注数据,尤其是病变分割所需的像素级标注,困难重重。手动诊断和标注病变不仅耗费大量时间,还容易出错,对于复杂的 3D OCT 图像和大规模组织病理学图像更是如此。
为解决标注数据不足的问题,无监督、半监督和弱监督学习方法应运而生。无监督病变检测方法仅依靠健康样本训练,试图构建一个只有正常数据能编码的潜在流形,以此检测病变,但这种方法存在局限性。弱监督病变定位方法利用图像级标签或粗标签构建分割模型,虽有一定进展,但现有方法普遍存在归因不精确和偏差问题。基于梯度的方法容易陷入局部最优,导致定位出现假阳性或假阴性;图像到图像(I2I)翻译方法虽能生成合成图像对来定位病变,但难以避免对无关区域的修改,即便采用了一些正则化方法,仍容易出现假阳性。
在这样的背景下,为了实现更精准的 OCT 图像病变定位,研究人员开展了基于引导反事实解释器模型的 OCT 图像弱监督病变定位与归因研究。他们提出了一种名为光学相干断层扫描类别关联嵌入(OCT-CAE)的方法,该研究成果发表在《Expert Systems with Applications》上。这一研究意义重大,它有望突破现有方法的局限,为 OCT 图像诊断提供更可靠的技术支持。
研究人员开展此项研究时,主要运用了以下关键技术方法:采用 ResNet50 构建弱监督模型Φ,该模型以图像x∈{n}(n=1?N)为输入,生成输出yc∈C 。基于 CycleGAN 的概念开发了模型Ψ,用于分解和反事实生成 OCT 图像。通过这两个模型的协同工作,实现对 OCT 图像的分析。
研究结果
- 病变定位与归因:研究人员在两个公开数据集上进行了广泛实验。通过 OCT-CAE 方法,将每个样本编码为一对子空间,其中低维公共子空间嵌入与分类相关的信息,个体子空间嵌入个体特定信息。训练好的 OCT-CAE 模型可以自由重组两个子空间的代码,生成逼真的图像。通过改变公共代码使生成图像的类别发生翻转,对比修改前后的图像,就能在无需区域标注的情况下识别病变区域。实验结果表明,OCT-CAE 能有效分离图像中的潜在信息空间,在病变定位和归因方面表现出色,生成了准确的显著性图,可视化了流形内的特征转换。
- 性能评估:在不同数据集上的定位和归因实验充分验证了 OCT-CAE 的性能。该方法能够在弱监督条件下,利用图像级标注实现精准的病变定位,减少了对像素级标注的依赖,提高了病变定位和归因的准确性,为医学影像的 AI 诊断提供了更可靠的依据。
研究结论与讨论
研究人员提出的 OCT-CAE 方法为 OCT 图像的弱监督病变定位提供了创新解决方案。它通过可解释人工智能(xAI)框架,将数据中与类别相关和不相关的信息分解到两个独立子空间。与类别相关的公共代码有助于解读 OCT 图像分类器的深层全局规则,通过操纵公共代码生成反事实图像,进而实现病变定位。
该方法有效避免了局部最优问题,减少了假阳性结果,在两个数据集上都取得了优异的性能表现,生成了精确的显著性图,提升了定位和归因的准确性。这不仅为眼科医生诊断视网膜病变提供了有力的辅助工具,还增强了人们对医学影像 AI 诊断的信任。同时,该研究也为后续相关研究提供了新思路和方法,推动了医学影像弱监督学习领域的发展,在医学健康领域具有重要的应用价值和研究意义。