基于多级特征增强与双注意力机制的高效骨质疏松诊断模型研究

【字体: 时间:2025年07月31日 来源:Neurocomputing 6.5

编辑推荐:

  本研究针对骨质疏松早期诊断的临床挑战,创新性地提出融合双注意力机制(DA)与多级特征融合(MLFF)的深度学习模型。以EfficientNetV2为骨干网络,结合深度语义提取(DSE)模块,显著提升膝关节X光图像关键区域识别能力。实验表明该模型在召回率(Recall)、精确度(Precision)、F1值和准确率(Accuracy)上全面超越现有方法,尤其降低假阳性率,为临床提供更可靠的AI辅助诊断工具。

  

骨质疏松被称为"沉默的流行病",全球约2亿患者深受其害,仅美国每年相关医疗支出就超200亿美元。这种以骨密度(BMD)下降为特征的疾病,常导致髋部、脊柱等部位骨折,致残率高达50%。虽然双能X线吸收法(DXA)是诊断金标准,但其存在辐射暴露、设备昂贵等局限,尤其在基层医疗机构普及率不足30%。更棘手的是,传统方法难以捕捉骨微结构的早期病变,当患者出现明显症状时,往往已错过最佳干预时机。

韩国全北国立大学(Chosun University)信息与通信工程系的Routhu Srinivasa Rao团队在《Neurocomputing》发表的研究,开创性地将计算机视觉前沿技术应用于骨质疏松诊断。研究人员采用EfficientNetV2作为基础架构,通过深度语义提取(DSE)模块解析X光图像中的空间上下文信息,结合特征金字塔网络(FPN)实现多尺度特征捕获。最具突破性的是引入双注意力机制(DA),使模型能像经验丰富的放射科医生那样,自动聚焦于骨小梁微结构等关键区域。

技术方法上,研究团队使用Mendeley提供的膝关节X光数据集,包含骨质疏松(49例)、骨量减少(154例)和正常(36例)三类样本。通过图像分割将双下肢影像分解为单侧样本,最终构建380例的数据集。模型训练采用PyTorch框架,在2块GeForce RTX 3090显卡上实现,通过消融实验验证各模块贡献。

多级特征融合的有效性
实验显示,结合DSE与MLFF的架构使F1值提升12.7%,证明多层次特征整合能更全面反映骨微结构变化。特征金字塔成功捕获了从宏观骨形态到微观骨小梁的多尺度信息。

注意力机制的优化作用
双注意力模块使模型在髌骨下极、胫骨平台等关键区域的关注度提升3.2倍,假阳性率降低19.8%。可视化分析表明,注意力权重分布与临床关注的骨质疏松特征区域高度吻合。

横向性能对比
与ResNet50、DenseNet201等基准模型相比,本研究的Recall达到94.3%,超越现有最优方法6.5个百分点。特别在骨量减少的早期识别上,AUC值达0.923,显示其在亚临床期诊断的潜力。

这项研究的临床意义在于:首先,提出的DA-MLFF框架首次实现膝关节X光片的自动化骨质疏松筛查,弥补DXA设备不足地区的诊断缺口;其次,模型对骨量减少的敏感检测为早期干预创造窗口期;最后,可解释性强的注意力可视化辅助医生定位病变区域。未来若能在更大样本中验证,该技术或将成为骨质疏松分级诊疗体系的重要组成,特别是对老年人群和绝经后妇女的定期筛查具有重要价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号