编辑推荐:
乳腺癌(BC)手动分类依赖专业病理学家,深度学习(DL)辅助诊断虽有发展,但存在黑箱性、缺乏可解释性等问题。研究人员基于视觉 Transformer(ViT)开展 BC 分类研究,所提模型性能超越传统卷积神经网络(CNN),且解释精准,有助于临床诊断。
癌症,这个人类健康的 “头号杀手”,时刻威胁着人们的生命安全。其中,乳腺癌(BC)在女性群体中尤为肆虐,已然成为女性癌症死亡的首要原因。早期诊断乳腺癌对于提高患者生存率至关重要,而组织病理学图像分析是检测乳腺癌分级的关键手段。在显微镜下,病理学家凭借专业知识,仔细观察乳腺组织标本的细胞结构,试图找出那些隐藏的癌细胞。然而,这项工作不仅需要高度专业的技能,还耗费大量时间和精力。
随着科技的发展,计算机辅助诊断(CAD)技术应运而生,深度学习(DL)算法更是为癌症检测带来了新的曙光。众多研究人员利用 DL 算法对大量组织病理学图像进行训练,期望提高乳腺癌诊断的准确性和速度。但这些基于 DL 的模型却像是一个个 “黑箱”,只知道输入图像和输出诊断结果,却无法解释模型内部的决策过程。在医疗这个敏感领域,医生们很难完全信任这样缺乏透明度的模型,这也限制了 DL 技术在临床中的广泛应用。
此外,传统的卷积神经网络(CNN)虽然在图像识别领域取得了不少成果,但在捕捉乳腺癌组织病理学图像中的全局特征信息时,存在一定的局限性。为了解决这些难题,来自未知研究机构的研究人员踏上了探索之旅,他们开展了一项关于基于视觉 Transformer(ViT)的可解释人工智能(XAI)用于乳腺癌分类的研究 ,相关成果发表在《Biomedical Signal Processing and Control》。
研究人员主要运用了以下关键技术方法:首先,使用了公开的 BreakHis 数据集作为研究样本。接着,对数据进行预处理,包括归一化和调整大小,并采用数据增强技术扩充数据。然后,利用迁移学习(TL)对 ViT 模型进行训练和微调,优化网络超参数。最后,运用六种 XAI 技术,如梯度加权类激活映射(Grad - CAM)、香草梯度(Vanilla gradient)、集成梯度(Integrated gradients)、显著性图(Saliency Maps)、局部可解释模型无关解释(LIME)和注意力图(Attention Maps),对模型预测结果进行解释。
研究结果
- 分类结果:研究人员重点关注训练准确率(TA)、验证准确率(VA)、训练损失(TL)等关键指标,通过观察这些指标的变化,有效监测模型的训练效果。结果显示,基于 ViT 模型和迁移学习构建的新 CAD 系统,在使用 BreakHis 数据集进行二元乳腺癌分类时,分类准确率高于当前最先进的方法。即使面对 BreakHis 数据集中类别不平衡的问题,该模型凭借成功的建模策略和特征工程,依然展现出了卓越的性能。
- 模型解释:利用六种 XAI 技术,研究人员为 ViT 模型的预测结果提供了清晰的解释。Grad - CAM 技术生成的热图,能够直观地展示出图像中对模型预测起关键作用的区域;LIME 方法则突出了输入图像中影响机器学习算法决策的重要区域,帮助人们理解模型的决策逻辑。这些解释增强了模型的透明度和可信度。
研究结论与讨论
这项研究成功开发并实施了一种基于 ViT 模型和迁移学习的新型 CAD 系统,用于乳腺癌的二元分类。该系统在分类准确率上超越了传统的 CNN 模型,为乳腺癌的临床诊断提供了更准确的辅助工具。同时,通过多种 XAI 技术的应用,有效解决了模型可解释性的问题,让医生能够更好地理解模型的决策依据,从而提高了对模型的信任度。这不仅有助于推动机器学习在临床领域的广泛应用,还为乳腺癌的早期诊断和治疗提供了更有力的支持,对改善患者的预后具有重要意义。未来,研究人员可以进一步优化模型,探索更多的 XAI 技术,提高模型在复杂临床场景下的性能,为乳腺癌的防治做出更大的贡献。