PatchBridgeNet:一种基于补丁的深度特征提取与分类模型,用于从OCT图像中自动诊断视网膜疾病
《Biomedical Signal Processing and Control》:PatchBridgeNet: a patch-based deep feature extraction and classification model for automated retinal disease diagnosis from OCT images
【字体:
大
中
小
】
时间:2025年11月20日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
本研究提出基于深度特征工程的PatchBridgeNet模型,结合MobileNetV2、DarkNet53和DenseNet201的多尺度特征提取能力,通过INCA算法和Chi-square统计方法优化特征选择,在OCTDL数据集上实现7类分类92.3%准确率和2类分类97.4%准确率,有效融合全局与局部特征提升视网膜疾病诊断性能。
人工智能在医疗健康领域的诊断与治疗过程中发挥着关键作用,特别是在早期疾病识别和个性化治疗方案制定方面。其中,光学相干断层扫描(Optical Coherence Tomography, OCT)作为一种重要的技术手段,为视网膜疾病的详细分析和分类提供了强大的支持。OCT利用光波获取高分辨率的横截面图像,自1991年由Huang等人提出以来,已广泛应用于眼科领域,对视网膜结构的异常变化进行检测,从而辅助疾病的诊断与治疗。此外,该技术还被应用于心内科、皮肤科、胃肠科和神经科等其他医学领域。然而,OCT图像的解读需要专业知识,特别是在分析视网膜层或病变等细节时。同时,由于OCT图像中缺乏明确的“真实标签”结构,即便是专家也难以进行精确测量。在此背景下,人工智能技术进一步增强了OCT的潜力,使得图像分析更加高效和准确。
近年来,系统综述研究强调了人工智能方法,尤其是深度学习和神经网络,在放射学、病理学和皮肤病学等领域的图像解读中展现出卓越的能力。这些方法通常比人类专家更快,且在某些情况下可以与人类专家的准确性相媲美。例如,基于深度学习的算法在检测糖尿病性视网膜病变(Diabetic Retinopathy, DR)和青光眼(Glaucoma)等疾病时,已经取得了较高的敏感性和特异性。对于糖尿病性视网膜病变的检测,敏感性达到95.9%,特异性达到97.9%;而青光眼的检测敏感性为91%,特异性为90%。在另一项研究中,通过深度迁移学习开发的混合进化加权集成模型在DR的检测中取得了最先进的性能。
尽管OCT在医疗领域具有广泛的应用前景,但其图像分析仍然面临诸多挑战,如需要大量且多样化的数据集、高计算资源需求以及缺乏标准化。为了解决这些问题,研究者们正在开发创新性的解决方案,如深度学习技术、迁移学习方法以及优化的计算策略。这些方法不仅提高了OCT图像分析的效率,还增强了其在实际应用中的适应性。特别是在早期诊断和疾病管理方面,人工智能与OCT的结合展现了巨大的潜力。
在现有文献中,已有大量基于机器学习和深度学习的研究针对OCT图像的分类问题展开。这些研究采用了多种方法,包括数据增强、分割和迁移学习等,以提高模型的性能。此外,视觉语言基础模型(Vision-Language Foundation Models)以及将OCT与其他成像方式结合的多模态方法,也在扩展分析范围和提升诊断能力方面取得了显著进展。迁移学习框架使得即使在数据量有限的情况下,也能利用预训练模型实现高性能的图像分析。
综上所述,现有研究展示了人工智能在OCT图像分析中的强大潜力,特别是在提高诊断准确性、敏感性和特异性方面。本研究旨在通过评估先进的特征提取方法在OCT图像分析中的创新应用,为该领域做出有意义的贡献。具体而言,我们提出了一个名为PatchBridgeNet的创新混合模型,该模型结合了预训练网络(如MobileNetV2、DarkNet53和DenseNet201)的强特征提取能力,以及我们提出的基于块(patch)的特征提取和选择方法。这一方法的引入,不仅弥补了现有研究在特征提取和分类方法上的不足,还为OCT图像分析提供了新的思路。
本研究的目标是解决现有文献中发现的某些关键问题。首先,OCTDL是一个在生物医学成像领域新引入的数据集,具有多类别分类任务的潜力。然而,自该数据集发布以来,相关研究的数量仍然有限。其次,目前使用OCTDL数据集的研究大多直接应用深度学习模型进行分类,而较少关注基于深度特征提取后,再通过传统分类器进行特征评估的方法。为了解决这些问题,我们提出了一个创新性的混合模型——PatchBridgeNet,该模型旨在充分利用OCTDL数据集的潜力,通过结合深度学习架构和基于块的特征提取与选择策略,提升分类性能。
在深度特征提取阶段,我们采用了一种基于块的方法,即将图像划分为固定大小的块,以便更有效地捕捉全局和局部特征。通过这一方法,我们可以从OCT图像中提取出具有代表性的特征,包括全局结构特征和局部病变特征。随后,我们利用INCA(迭代邻域成分分析)算法和Chi2(卡方)统计方法对这些特征进行优化,并使用支持向量机(Support Vector Machines, SVM)进行分类。这种方法不仅提高了分类的准确性,还增强了模型对数据集不平衡问题的处理能力。
PatchBridgeNet模型在OCTDL数据集上的表现尤为突出。在7类分类任务(Case 1)中,模型达到了92.3%的准确率;而在2类分类任务(Case 2)中,模型的准确率更是高达97.4%。这一结果表明,PatchBridgeNet在处理小规模且不平衡的数据集时,仍然能够保持较高的性能。此外,该模型在提取局部特征方面也表现出色,能够独立分析OCT图像中的各个区域,从而捕捉到微小但关键的信息。这种基于块的结构使得模型在分析过程中更加细致和全面,为视网膜疾病的诊断提供了有力支持。
本研究的创新点在于将预训练网络的强特征提取能力与基于块的特征提取和选择方法相结合,从而构建出一个更加高效的模型。这一方法不仅弥补了现有研究在特征提取和分类上的不足,还为OCT图像分析提供了新的视角。此外,通过引入INCA和Chi2方法对特征进行优化,使得模型在分类任务中更加准确和鲁棒。最后,PatchBridgeNet在处理数据集不平衡问题时展现出良好的适应性,这一特点对于实际应用具有重要意义。
本研究的主要贡献在于,首次在OCTDL数据集上应用基于块的特征提取和选择方法,并验证了该方法在多类别和二分类任务中的有效性。通过这一方法,我们不仅提高了模型的分类性能,还为OCT图像分析提供了一种新的框架。此外,该模型在处理小规模数据集时仍然能够保持较高的准确率,这一特点对于资源有限的医疗机构具有重要价值。因此,本研究为OCT图像分析和生物医学图像处理领域提供了新的方法和思路,有助于推动该技术在临床中的应用。
本研究的实验部分采用了标准的硬件配置,包括搭载AMD Ryzen 5 5600H处理器、NVIDIA GeForce RTX 3060 Laptop GPU和16GB RAM的基本用户计算机。这种硬件配置能够高效处理时间复杂度较低的任务,同时也能够验证模型在实际应用环境中的性能表现。通过在该硬件平台上进行测试,我们确保了模型的适用性和稳定性,使其能够在真实医疗场景中发挥作用。
在实验过程中,我们对PatchBridgeNet模型的分类性能进行了评估,包括多类别(7类)和二分类(2类)任务。通过对比分析,我们发现该模型在不同任务中的表现均优于现有方法。此外,模型在处理数据集不平衡问题时展现出良好的鲁棒性,这表明其在实际应用中具有广泛的适应性。通过这些实验,我们验证了PatchBridgeNet在视网膜疾病分类中的有效性,并为其在其他医学图像分析中的应用提供了依据。
在讨论部分,我们分析了PatchBridgeNet模型在OCT图像分析中的优势。该模型能够有效捕捉OCT图像中的全局和局部特征,从而提供更加全面的分析结果。通过将预训练网络的强特征提取能力与基于块的结构相结合,我们构建了一个更加高效的模型。此外,该模型在处理小规模和不平衡数据集时仍然能够保持较高的性能,这表明其在实际应用中的适用性。通过这些分析,我们进一步验证了模型在视网膜疾病分类中的潜力,并为其在其他医学图像分析中的应用提供了参考。
在结论部分,我们总结了本研究的主要成果。PatchBridgeNet模型在视网膜疾病分类任务中表现出色,其结合不同深度学习架构的能力使得模型在多类别和二分类任务中均取得了较高的准确率。此外,该模型的基于块的结构使得其能够独立分析OCT图像中的各个区域,从而捕捉到微小但关键的信息。这些特点使得PatchBridgeNet在处理OCT图像时更加高效和准确,为视网膜疾病的早期诊断和治疗提供了有力支持。同时,该模型在处理数据集不平衡问题时也展现出良好的适应性,这表明其在实际应用中具有广泛价值。
本研究得到了土耳其科技研究委员会(TUBITAK)ARDEB 1001项目(Grant No: 124E514)和埃尔祖鲁姆技术大学科研协调单位(Project No: 2025/054)的支持。这些资助为研究提供了必要的资金和资源,使得我们能够顺利开展实验和数据分析工作。此外,我们声明不存在可能影响本研究结果的财务利益或个人关系。因此,本研究的成果具有较高的可信度和客观性。
综上所述,本研究通过提出一种名为PatchBridgeNet的创新混合模型,为OCT图像分析提供了全新的方法和思路。该模型结合了预训练网络的强特征提取能力与基于块的结构,使得其能够有效捕捉OCT图像中的全局和局部特征,并通过优化的特征选择方法实现更高的分类准确率。这些方法不仅提高了模型的性能,还为视网膜疾病的早期诊断和治疗提供了有力支持。此外,该模型在处理数据集不平衡问题时也表现出良好的适应性,使其在实际应用中更加可靠和高效。因此,本研究在生物医学图像分析领域具有重要意义,并为未来的相关研究提供了参考和借鉴。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号