编辑推荐:
为解决传统卷积神经网络(CNNs)在阿尔茨海默病(AD)诊断中无法捕捉全局信息,以及视觉 Transformer(ViTs)计算资源需求大的问题,研究人员开展 LRAD-ViT 模型研究。结果显示该模型诊断准确率高且计算需求降低 40%,对 AD 早期诊断意义重大。
在当今社会,阿尔茨海默病(Alzheimer's Disease,AD)正逐渐成为一个严峻的健康挑战。这种疾病以进行性认知衰退和神经元丢失为特征,给患者及其家庭带来了沉重的负担。在医学领域,早期且准确地诊断 AD 至关重要,因为这能为及时干预争取宝贵时间,延缓疾病进展,同时也有助于患者及其家属提前规划未来生活。
磁共振成像(Magnetic Resonance Imaging,MRI)凭借其无需电离辐射就能提供详细大脑解剖信息的优势,成为 AD 诊断的关键手段。然而,解读 MRI 数据并非易事,它需要专业知识,且人工分析耗时费力,还容易因疲劳、观察者差异等因素出现误差。因此,计算机辅助诊断(Computer-Aided Diagnosis,CAD)系统应运而生,有望提升 AD 诊断和管理的效率与准确性。
在 AD 诊断的研究道路上,机器学习技术被广泛探索。传统方法常依赖手工制作的特征和支持向量机(SVM)、逻辑回归等分类器,虽在 AD 与认知正常(Cognitive Normal,CN)的分类上取得了一定成果,但手工特征工程的局限性、对噪声和数据不平衡的敏感性,阻碍了其进一步发展。随着深度学习的兴起,卷积神经网络(Convolutional Neural Networks,CNNs)在医学影像分析领域掀起了一场革命。它通过内核参数共享,具备局部性、空间不变性和平移等变性等强归纳偏差,能在相对有限的训练数据下实现良好的泛化。不过,CNN 也存在短板,卷积操作主要捕捉局部特征,难以建模图像的全局上下文关系,其低 Lipschitz 常数和有限的非线性表达能力,限制了对复杂映射的学习,并且它只适用于网格结构数据,在处理顺序或多模态输入时存在困难。
与此同时,源于自然语言处理领域的 Transformer 架构,在计算机视觉任务中崭露头角。视觉 Transformer(Vision Transformers,ViTs)将图像补丁视为输入令牌,利用自注意力机制对输入序列分配上下文权重,能有效捕捉长距离依赖关系,学习丰富的全局表示,在图像分类、目标检测和语义分割等任务中表现出色。但 ViTs 也有自身的问题,其对计算资源的需求巨大,且由于归纳偏差有限,通常需要大量训练数据才能达到最佳性能。
为了攻克这些难题,来自未知研究机构的研究人员开展了一项关于阿尔茨海默病诊断的创新性研究。他们提出了一种名为 Lightweight Robust Alzheimer's Disease Vision Transformer(LRAD-ViT)的计算高效框架,专门用于 AD 的早期检测。
研究人员在这项研究中运用了多种关键技术方法。他们从阿尔茨海默病神经影像学倡议(Alzheimer's Disease Neuroimaging Initiative,ADNI)获取了两个大脑 MRI 数据集,分别包含轴向和矢状面 MRI 切片,采用了受试者级别的分区方法创建训练集和测试集。在模型构建方面,设计了由令牌生成模块、自适应令牌融合 Transformer 编码器和随机学习正则化组成的 LRAD-ViT 架构。其中,自适应令牌融合方法能自动检测和合并大脑 MRI 图像中对 AD 检测不重要的补丁令牌,减少计算量;随机学习正则化(Randomized Learning Regularization,RLR)模块则被集成到分类头中,通过引入随机投影防止过拟合,增强模型的泛化能力和鲁棒性 ,并且模型还使用了 ImageNet 的预训练权重进行初始化。
研究结果
- 模型架构设计:LRAD-ViT 架构通过令牌生成模块将 2D 大脑 MRI 切片划分为固定大小的非重叠补丁,并将其线性投影。自适应令牌融合 Transformer 编码器能自动识别并合并非必要令牌,优化计算效率,同时不影响诊断性能。随机学习正则化模块的加入,改善了模型的学习动态和鲁棒性。
- 模型性能评估:在 VSCODE 开发平台上,利用 PyTorch 库和 NVIDIA RTX 3090 GPU 对 LRAD-ViT 模型进行评估。结果显示,在区分 AD 与 CN 时,模型诊断准确率达到 93.41%;在区分 CN 与轻度认知障碍(Mild Cognitive Impairment,MCI)时,准确率为 90.95%,并且计算需求降低了约 40%。这表明 LRAD-ViT 在保证诊断准确性的同时,大大提升了计算效率。
研究结论与讨论
这项研究成果意义非凡。LRAD-ViT 模型充分利用了 ViT 的全局学习能力,通过创新的自适应令牌融合方法和随机学习正则化,在 AD 早期诊断中展现出了卓越的诊断准确性和计算效率。自适应令牌融合技术能够选择性地合并和丢弃非必要令牌,显著提高了计算效率;随机学习正则化则增强了模型在有限数据条件下的泛化能力和鲁棒性。而且,该模型可以处理与 AD 进展相关的多个二元分类任务,如 AD 与 CN、CN 与 MCI、AD 与 MCI 的区分,具有很强的通用性,在临床实践中具有广阔的应用前景。这一研究成果发表在《Engineering Applications of Artificial Intelligence》上,为阿尔茨海默病的早期精准诊断提供了新的有力工具,推动了医学领域在 AD 诊断方面的发展,有望为更多患者带来福音。