《Biomedical Signal Processing and Control》:SAEDCNN: A Sparse Autoencoder-Based Distributed CNN for accurate biomedical hyperspectral image classification
编辑推荐:
精准肿瘤边界的术中识别对减少健康组织切除至关重要,高光谱成像(HSI)结合半监督深度学习可提升癌症诊断精度。本研究提出SAEDCNN模型,集成稀疏自编码器、分布式卷积神经网络及双级混合注意力机制,在胆管癌和脑癌数据集上达到97%以上分类准确率,有效缓解标注数据稀缺问题。
Sikhakolli Sravan Kumar|Suresh Aala|Pooja A Nair|Vineela Chandra Dodda|Inbarasan Muniraj|Sunil Chinnadurai|Anuj Deshpande
电子与通信工程系,SRM大学-AP,安得拉邦,522240,印度
摘要 目的: 在手术切除过程中准确识别肿瘤边缘对于减少健康组织的切除至关重要。高光谱成像(HSI)凭借其详细的光谱数据,提高了区分癌组织和正常组织的能力。本研究提出了一种半监督深度学习方法,该方法利用HSI来支持术中决策,即使标注数据有限也是如此。
材料与方法: 我们提出了一种基于半监督稀疏自编码器的分布式卷积神经网络(SAEDCNN),它同时使用了标记和伪标记的HSI数据。该模型在稀疏自编码器驱动的CNN架构中集成了ResNet-101、局部角度模式(LAP)、局部相位量化(LPQ)、Ablation-CAM和VGG-Net等高级特征提取器。引入了一种新颖的混合注意力模块——瓶颈和高效通道注意力(BNEC),以增强特征细化能力同时降低计算成本。为了进一步提高分割精度,采用了结合分类交叉熵(CCE)和铰链损失(hinge loss)的混合损失函数。
结果: SAEDCNN在涉及肝胆管癌(cholangiocarcinoma)和脑癌的基准生物医学HSI数据集上实现了超过97%的分类准确率。即使在有限的监督下,它在分割和分类任务中也表现良好。BNEC和混合损失函数的加入提升了特征学习能力和模型泛化能力。
结论: HSI与半监督深度学习的结合使得肿瘤检测更加精确,同时对大型标注数据集的依赖性降低。SAEDCNN具有高诊断准确性和计算效率,非常适合临床生物医学成像应用。
引言 胆管癌和脑癌都是侵袭性很强的癌症类型,导致大量患者死亡。脑肿瘤,尤其是胶质母细胞瘤,占全球所有癌症死亡的约2.5%。胶质母细胞瘤几乎占所有恶性脑肿瘤的50% [1]。印度脑癌发病率的上升凸显了早期诊断所需先进技术的必要性 [2]。胆管癌是一种罕见的胆管恶性肿瘤 [3],其早期诊断仍然存在困难,导致预后较差。这些数据表明,寻找新的疾病诊断方法非常重要。常见的诊断方法如放射成像 [4]、CA-19检测 [5]、计算机断层扫描(CT)[6] 和磁共振成像(MRI)[7] 被广泛使用,但它们可能费用高昂、具有侵入性,并且如果使用频繁可能会产生副作用。高光谱成像(HSI)和深度学习(DL)最近在提高检测和分类准确性方面显示出潜力 [8]、[9],能够提供非侵入性的高分辨率组织特征洞察 [10]。HSI拥有丰富的空间和光谱信息,在遥感领域(如分类和分割 [11]、[12]、[13])中非常有用,并且在生物医学成像中因能够区分恶性组织和正常组织而受到关注 [14]、[15]。
研究表明,HSI可以通过分析像素级别的生化成分来增强肿瘤的分割和检测。例如,Sun等人(2021年)使用HSI在胆管癌检测中实现了高灵敏度和特异性 [16],而Fabelo等人(2018年)展示了比传统方法更好的脑肿瘤分割效果 [17]。类似地,Guerri等人(2024年)提供了关于使用HSI进行农业 [18] 和岩性 [19] 分割的深度学习技术的综述。
基于HSI数据的癌症分割和分类的机器学习方法分为三类:监督学习、无监督学习和半监督学习。特别是CNN,已经通过大型标注数据集被广泛用于基于HSI的癌症检测。例如,Sravan Kumar等人(2024年)使用3D U-Net对胆管癌组织进行了分析,实现了94.48%的分类准确率 [20]。基于Transformer的模型,如Vision Transformers(ViTs)[21],也被用来捕捉空间-光谱依赖性。最近的先进模型如MRANet [22]、HCLA U-Net [23] 和MAEFNet [24] 也被纳入了文献综述。这些模型分别结合了残差注意力、高级通道注意力和基于MLP的注意力机制,提高了分类准确率。然而,监督学习模型需要大量的标注数据,而这些数据往往由于手动标注的工作量庞大而难以获得。
无监督学习技术,如k-means聚类和自组织映射(SOMs),在没有标注数据的情况下用于提取光谱特征。降维技术,如PCA和NMF,在保持光谱完整性的同时提高了特征提取效果 [20]。尽管这些方法看起来很有前景,但由于缺乏足够的标注监督,它们通常难以泛化。Aala等人展示了基于自编码器的架构... Ranjan等人(2025年)在遥感领域展示了有效的特征学习,但在医学成像中的应用研究还不够充分。为了弥补这一差距,半监督学习(SSL)作为一种有吸引力的替代方案应运而生。SSL利用小型标注数据集和大型伪标注数据集来提高分类性能,这在专家标注稀缺的生物医学成像中至关重要 [25]、[26]。已经开发了几种用于HSI分析的SSL框架。He等人 [27] 提出了一种结合光谱-空间特征的3D CNN,而Liu等人 [28] 提出了一种保持空间局部性的基于超图的SSL。Xiang等人 [25] 开发了FUSSNet来处理不确定性类型,提高了分割的可靠性。Hu等人 [29] 应用了对比学习来在最少标签的情况下提升泛化能力。Zhang等人 [26] 提出了一种同时学习分割图和符号距离函数的双任务模型。基于GAN的光谱-空间学习 [27] 和基于ResNet的协同训练 [30] 进一步强调了SSL在生物医学HSI中的多功能性。
在癌症检测中,深度学习模型始终表现出高性能。Rajan等人 [31] 使用OCT Deep Net2在视网膜疾病分类中实现了98%的准确率。Sekharan等人 [32] 将CNN与高斯混合模型结合用于胰腺癌预测。Khan等人 [33] 提出了结合DenseNet-201、NasNetMobile和VGG16的多Net集成模型,分别在二元和多类乳腺癌检测中实现了99%和98%的准确率。Paralic等人 [34] 使用混合3D CNN和ConvLSTM识别脑动脉瘤,展示了出色的空间-时间建模能力。这些进展验证了半监督学习(SSL)在生物医学高光谱成像(HSI)诊断中的重要性,特别是在标注数据稀缺的情况下。但当前的SSL方法仍存在问题,如运行成本高、对噪声敏感以及无法处理多种数据集。为了解决这些问题,我们提出了一种新的半监督架构,称为基于稀疏自编码器的分布式CNN(SAEDCNN)。该模型结合了空间和光谱信息,同时使用标记和伪标记数据来提高分割和分类的准确性。SAEDCNN专门用于检测脑癌和胆管癌,并且适用于多种生物医学数据集。我们的框架使用光谱注意力机制和对比学习来提高特征提取效果,减少对大型标注数据集的需求,并使其更容易在不同HSI分布中泛化。本研究旨在提供一种强大且高效的生物医学癌症检测解决方案,克服了以往方法的重大局限性。这些贡献,特别是稀疏AE光谱嵌入、分布式CNN分组和双层混合注意力(ECA + BNEC)的整合,使我们的方法与当前的半监督或混合注意力HSI模型明显不同。
尽管许多高光谱成像研究已经探讨了混合注意力机制或半监督CNN架构,但我们提出的SAEDCNN具有三个显著特点。SAEDCNN模型与其他混合注意力模型的不同之处在于,它使用基于稀疏自编码器的光谱嵌入,减少了每个像素的光谱冗余,同时保持了完整的空间分辨率。这种保留光谱的瓶颈输入到分布式CNN分支的方法在之前的SSL-HSI流程中并未出现。
其次,该模型结合了双层混合注意力机制(ECA + BNEC),其中BNEC模块执行带状归一化,随后进行嵌入式通道重新校准,共同稳定了光谱变化并增强了空间边界完整性。这种光谱校准和空间细化的特定组合在之前发布的注意力框架中是独一无二的。
第三,SAEDCNN采用了一种实用的半监督训练策略,包括基于置信度过滤的伪标记、迭代伪标记细化和可控的伪损失加权。这形成了一个完整的AE → 分布式CNN → 混合注意力 → 迭代SSL流程,这是早期HSI文献中未涉及的组合。为了突出这些区别,我们将我们的设计与近期文献中的代表性SSL和基于注意力的HSI方法进行了对比。综上所述,上述元素定义了所提出的BNEC-SAEDCNN框架的新颖性。
最近在半监督和自监督表示学习方面的进展包括掩码(MAE风格)光谱自编码 [35]、对比预训练和对比回归 [36],以及新的HSI基准和综合综述 [37]。Ben等人 [38] 通过使用基于自编码器的框架在标签稀缺的情况下展示了明显的优势,用于乳腺癌分析。这些方法可以作为我们流程的强大无监督预训练阶段,在微调稀疏AE、分布式CNN和BNEC堆栈之前发挥作用。
方法与步骤 材料与方法 在这项研究中,我们提出了一种基于深度学习的高光谱生物医学图像分割和分类方法,该方法结合了特征提取技术、SAEDCNN模型和混合损失函数。该方法遵循一个结构化的流程,从输入高光谱图像的预处理开始,然后使用改进的ResVNET架构进行分割,以帮助识别图像中的边界,并提取特征
结果 在本节中,我们展示了使用所提出的SAEDCNN框架获得的结果,以及整个工作流程中各个关键阶段的输出,包括预处理、分割、特征提取和分类。使用高光谱成像对胆管癌和脑组织进行分析的全面分割和分类流程分别如图7和图8所示。图7(a) 显示了组织的输入高光谱图像
讨论 图9中的性能比较清楚地表明,所提出的基于混合注意力的SAEDCNN模型(BNEC-SAEDCNN)优于现有的深度学习架构,如Dsc-CBAM、FERDCNN、3DCNN结合ConvLSTM和MultiNet。该混合模型在包括准确性、精确度、召回率、F1分数和Matthews相关系数(MCC)在内的关键评估指标上始终优于这些方法,无论训练百分比如何变化。
结论 在这项工作中,我们介绍了BNEC-SAEDCNN,这是一种半监督的高光谱生物医学分类框架,它结合了基于稀疏自编码器的光谱嵌入、分布式CNN特征提取和混合ECA-BNEC注意力模块。该模型在胆管癌和脑癌数据集上始终表现出高性能,即使在标注数据有限的情况下也显示出强大的泛化能力。所提出的自适应混合损失和基于置信度的伪标记
CRediT作者贡献声明 Sikhakolli Sravan Kumar: 软件、形式分析、数据管理、概念化。Suresh Aala: 方法论。Pooja A Nair: 方法论。Vineela Chandra Dodda: 软件。Inbarasan Muniraj: 监督。Sunil Chinnadurai: 监督。Anuj Deshpande: 撰写——原始草稿、监督、概念化。
伦理声明 本材料是作者的原创工作,尚未在其他地方发表。论文真实且完整地反映了作者自己的研究和分析。所有作者都亲自积极参与了导致该论文的实质性工作,并将对内容承担公共责任。
利益冲突声明 作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
致谢 本工作未获得公共、商业或非营利部门的任何资助。