基于磁共振成像的治疗性调节性T细胞命运映射：当前策略与转化前景

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Nanomaterials》：Mapping Therapeutic Regulatory T Cell Fate with MRI: Current Strategies and Translational Outlook

【字体：大中小】 时间：2026年06月09日 来源：Nanomaterials 4.3

编辑推荐：

　　阿尔茨海默病（Alzheimer’s disease，AD）是一种进行性神经退行性疾病，需要早期且准确的诊断以改善患者结局。本文提出了一种注意力增强的混合深度学习（deep learning，DL）框架，将卷积神经网络（Convolutional Neural

阿尔茨海默病（Alzheimer’s disease，AD）是一种进行性神经退行性疾病，需要早期且准确的诊断以改善患者结局。本文提出了一种注意力增强的混合深度学习（deep learning，DL）框架，将卷积神经网络（Convolutional Neural Network，CNN）与Swin Transformer（Swin-T）架构相结合，用于阿尔茨海默病的多分类任务。所提出模型集成了注意力机制，以增强特征表征并提高分类性能。研究人员在包含3个类别的数据集上开展实验：轻度痴呆（Mild Demented）、极轻度痴呆（Very Mild Demented）和非痴呆（Non-Demented）。为提高模型泛化能力，研究中采用了数据增强技术以提升模型性能。此外，研究中引入了3种可解释人工智能（explainable artificial intelligence，XAI）技术，包括Grad-CAM++、积分梯度（Integrated Gradients）和显著图（Saliency maps），用于解释模型预测结果并为决策过程提供可视化洞见。所提出的注意力增强混合CNN–Swin-T模型在测试中取得了99.92%的准确率（accuracy），精确率（precision）、召回率（recall）和F1值（F1-score）分别达到99.71%、99.73%和99.72%。与所实现的3种模型——基线CNN、独立Swin-T以及混合CNN–Swin-T——相比，带注意力机制的混合CNN–Swin-T表现更优。可解释性结果验证了该模型能够聚焦于相关区域，从而增强了对自动化诊断系统的信任。最后，研究通过比较分析与消融研究表明，将注意力机制与混合CNN–Swin-T架构相结合，可获得最高性能，并较其他3种模型提供更可靠的预测。

该文发表于《Nanomaterials》，但从全文内容看，研究主题并非纳米材料本体，而是基于磁共振成像（magnetic resonance imaging，MRI）的阿尔茨海默病（Alzheimer’s disease，AD）多分类智能诊断。研究背景在于，AD作为全球范围内重要的进行性神经退行性疾病，随人口老龄化而患病负担持续加重。临床上，尽早识别轻度痴呆、极轻度痴呆及非痴呆状态，对于干预时机把握、疾病管理优化以及延缓病程进展具有重要意义。现有医学影像分析方法虽已广泛引入深度学习（deep learning，DL），但仍面临若干关键问题：其一，卷积神经网络（Convolutional Neural Network，CNN）擅长提取局部空间特征，却难以充分建模长程依赖与全局上下文信息；其二，Transformer类架构虽具备全局建模优势，但对局部精细结构的把握并不总是充分；其三，AD不同分期之间在MRI上的差异较为细微，类别间视觉特征存在重叠；其四，医学数据集规模有限且类别分布不均衡，影响模型泛化与稳健性；其五，许多高性能模型缺乏足够可解释性，制约了临床采纳。因此，研究人员开展本研究，旨在构建兼具高精度、稳健性与可解释性的AD自动分类框架。

为解决上述问题，研究人员提出了注意力增强混合CNN–Swin-T模型，将CNN的局部特征提取能力与Swin Transformer（Swin-T，分层视觉Transformer）的全局上下文建模能力进行融合，并进一步引入注意力机制，对更具判别力的影像区域赋予更高权重。在此基础上，研究还整合Grad-CAM++、积分梯度和显著图3类可解释人工智能（XAI）方法，对模型决策依据进行可视化分析。研究结论表明，该混合框架在AD多分类任务中优于单独CNN、单独Swin-T以及未加注意力的混合CNN–Swin-T模型；同时，数据增强与超参数优化对性能提升具有显著作用；XAI结果显示，模型聚焦于更具临床相关性的脑区，从而增强了自动诊断结果的透明性与可信度。该研究的重要意义在于提出了一个兼顾局部与全局表征、分类性能与解释能力的统一流程，为AD影像辅助诊断提供了具有潜在临床应用价值的技术方案。

在技术方法方面，研究人员使用Kaggle公开阿尔茨海默病MRI数据集，共6336幅图像，包含非痴呆、轻度痴呆和极轻度痴呆3类，并按患者层面进行80%训练集、20%测试集划分。所有图像统一预处理为224 × 224像素并归一化；对训练集实施旋转、平移、剪切、缩放和水平翻转等数据增强。模型层面构建并比较4种架构：CNN、Swin-T、混合CNN–Swin-T及注意力增强混合CNN–Swin-T。训练采用Adam优化器、学习率1 × 10^?5、批量大小32、训练30轮，并结合提前停止策略。性能评估指标包括准确率、精确率、召回率和F1值，同时采用Grad-CAM++、积分梯度和显著图开展解释性分析，并进行5折交叉验证。

在研究结果部分，论文围绕多个小节逐步展开。

3.1. Overview and Workflow Architecture
研究人员首先构建了完整工作流程，涵盖数据获取、预处理、增强、模型训练、性能评估及XAI解释。通过这一流程，研究明确了从输入MRI图像到输出AD类别预测及可解释性结果的端到端框架，证明该方法不仅关注分类准确性，也强调模型透明性。

3.2. Dataset
研究使用Kaggle公开MRI数据集，共6336幅脑部图像，其中非痴呆3200幅、轻度痴呆896幅、极轻度痴呆2240幅。研究指出该数据集存在中度类别不平衡，尤其轻度痴呆样本明显偏少，这为模型训练带来挑战，也构成开展数据增强和稳健性设计的直接依据。

3.3. Data Processing and Augmentation
通过图像尺寸统一、像素归一化和定向数据增强，研究人员扩充了训练样本多样性并减轻类别不平衡。每幅原始图像额外生成5幅增强图像，所用策略包括受控旋转、宽高位移、剪切变换、缩放及水平翻转。研究由此得出结论：合理增强既可降低过拟合，又可提高模型对少数类尤其轻度痴呆类别的识别能力。

3.4. The Architecture of Proposed Models
本节系统介绍4类模型。CNN作为基线模型，主要提取边缘、纹理和形状等局部层级特征；Swin-T依赖窗口多头自注意力（self-attention）和移位窗口机制提取全局上下文；混合CNN–Swin-T通过特征拼接融合局部与全局表征；注意力增强混合CNN–Swin-T则在融合基础上进一步引入注意力模块，对关键特征进行加权筛选。由模型设计可见，研究核心在于通过结构互补提高对细微病变差异的辨识力。

3.5. Optimization Strategy and Training Configuration
研究采用Adam优化器、分类交叉熵损失函数（categorical cross-entropy loss）、30轮训练和提前停止机制。文中同时报告了模型复杂度：CNN训练约20 min、参数量94,851；Swin-T约180 min、参数量27,522,090；混合模型约190 min、参数量27,619,757；注意力增强混合模型约200 min、参数量27,754,182。结果说明，更高性能伴随更高计算成本。

3.6. Explainable Artificial Intelligence (XAI)
研究将Grad-CAM++、积分梯度和显著图统一纳入解释框架，并对4种模型使用同一输入样本进行对比。通过区域级与像素级双重解释，研究建立了模型级和类别级的系统化可解释性分析体系，证明解释性是该研究设计的重要组成部分，而非附属展示。

4. Performance Evaluation Methods
研究采用混淆矩阵、准确率、精确率、召回率和F1值评价多分类性能。此部分说明，研究并非仅依赖单一总体准确率，而是通过多维指标考察类别层面的识别能力，尤其适用于类别不均衡场景。

5.1. Model Performance Comparison
在无数据增强条件下，CNN准确率为97.58%，明显低于其他模型；注意力增强混合CNN–Swin-T达到98.50%，为该条件下最佳。加入数据增强后，所有模型性能均提高，其中CNN提升至98.32%，Swin-T和混合模型进一步改善，而注意力增强混合CNN–Swin-T达到最高测试准确率99.92%，精确率99.71%，召回率99.73%，F1值99.72%。该结果表明，融合架构、注意力机制与数据增强具有协同增益作用。

5.2. Training Behavior Analysis
训练行为分析显示，CNN在训练与测试准确率曲线、损失曲线方面波动较大，收敛较慢；Swin-T更稳定；混合CNN–Swin-T进一步改善收敛表现；注意力增强混合CNN–Swin-T则表现出最快、最稳定的收敛过程，训练与测试曲线间差距最小，损失下降平滑。研究据此认为，注意力机制提升了学习效率并抑制了过拟合。

5.3. Confusion Matrix Analysis
混淆矩阵分析显示，CNN在轻度痴呆与极轻度痴呆之间误分类较多；Swin-T误分类减少；混合CNN–Swin-T进一步降低类别混淆；注意力增强混合CNN–Swin-T几乎将所有预测集中于对角线，显示近乎完美的分类效果。这说明该模型在区分视觉差异细微的疾病阶段方面具备最强能力。

5.4. Classification Report and Cross-Validation Analysis
分类报告提示，所提出模型在非痴呆、轻度痴呆和极轻度痴呆三类上均获得较高且均衡的精确率、召回率和F1值，说明模型未明显偏向任何单一类别。5折交叉验证平均准确率达到99.93%，进一步证明模型在不同数据折上的稳健性与可重复性。

5.5. Explainability Results
在跨模型解释性比较中，Grad-CAM++结果显示CNN激活区域较分散，Swin-T定位更好但仍可能包含无关区域，混合CNN–Swin-T聚焦程度更高，而注意力增强混合CNN–Swin-T呈现最精确、最集中的激活模式。积分梯度图表明该模型在像素级归因上能更清晰地捕捉细微结构变化；显著图则显示其梯度模式更规整、噪声更少。类别层面分析进一步说明，该模型会随类别变化而调整关注重点：对非痴呆样本呈现较分散的正常结构关注，对轻度痴呆和极轻度痴呆则更集中于早期结构改变与脑萎缩相关区域。由此可见，模型不仅“分得准”，也“看得对”。

6. Discussion
讨论部分总结指出，模型性能的逐级提升反映了不同架构能力的互补关系：CNN长于局部、Swin-T长于全局、混合结构实现信息融合、注意力模块则进一步强化判别区域选择。数据增强在有限样本条件下显著提升了泛化能力，但仅靠增强不能完全弥补结构本身的局限。训练稳定性分析、误分类模式分析和XAI结果共同支持一个核心结论：注意力增强混合CNN–Swin-T在性能、稳定性和可解释性三方面均最优。消融研究进一步显示，批量大小32、学习率1 × 10^?5、训练30轮、Adam优化器及分类交叉熵损失函数的组合，为4种模型均带来更优表现，说明超参数精细调优对最终准确率提升具有重要贡献。研究同时坦陈局限，包括数据集规模与多样性有限、计算复杂度较高、仍存在过拟合风险、缺乏大规模真实世界临床验证、未融合多模态临床信息，以及对其他成像模态和疾病任务的泛化能力尚待检验。

研究结论部分可译为：本文提出了一种注意力增强的混合深度学习框架，将CNN与Swin-T架构相结合，用于阿尔茨海默病的多分类。所提出模型利用CNN捕获局部空间特征的优势，以及基于Transformer模型建模全局上下文关系的能力，同时通过引入注意力机制，使模型聚焦于输入图像中最相关的区域，从而增强特征表征。结果表明，带注意力机制的混合CNN–Swin-T模型优于基线架构，包括独立CNN、独立Swin-T及混合CNN–Swin-T模型。所提出的注意力增强混合CNN–Swin-T模型实现了99.92%的分类准确率，精确率、F1值和召回率分别达到99.71%、99.73%和99.72%，表明其在区分非痴呆、轻度痴呆和极轻度痴呆方面具有良好的稳健性与有效性。结果还强调了数据增强在有限MRI医学图像条件下提升模型泛化能力和性能的重要作用。除高分类精度外，Grad-CAM++、积分梯度和显著图等XAI技术的整合，为模型决策过程提供了有价值的解释信息。解释性分析证实，该模型聚焦于具有意义且具临床相关性的区域，从而增强了透明性并提高了对自动诊断系统的信任度。

联系信箱：

粤ICP备09063491号

热点排行