DGA-Net:一种用于医学图像中肝脏肿瘤分割的双分支组聚合网络

【字体: 时间:2025年11月27日 来源:Frontiers in Medical Technology 3.8

编辑推荐:

  针对肝细胞癌(HCC)的高侵袭性和分割难题,本文提出DGA-Net双分支网络架构,结合傅里叶光谱学习、多轴哈达玛德注意力及跨分支聚合模块,有效提升肝脏和肿瘤分割精度,在LiTS2017和3DIRCADb数据集上表现最优,DPC达94.84%和69.51%,显著优于SOTA方法。

  
肝细胞癌(HCC)作为全球范围内高发恶性肿瘤之一,其精准分割在临床诊断、手术规划及疗效评估中具有关键作用。传统分割方法依赖人工经验,存在效率低、主观性强、边界定位不精确等问题。近年来,基于深度学习的自动分割技术逐步成为研究热点,但现有模型仍面临三大核心挑战:1)局部与全局特征融合不足,难以捕捉肿瘤边界模糊及小病灶稀疏分布特征;2)多尺度特征整合效率低,导致信息冗余或冲突;3)模型参数膨胀与计算成本高,限制了其在资源受限临床场景的应用。针对上述问题,本文提出了一种双分支协同聚合网络(DGA-Net),通过融合频谱学习、多轴注意力机制与动态特征聚合模块,显著提升了分割精度与计算效率。

### 一、技术架构与核心创新
DGA-Net采用“双分支编码器+动态聚合解码器”的架构设计。编码器包含两个并行分支:FSMF分支通过傅里叶频谱分析提取组织亮度(振幅)与微观结构(相位)特征,MAHA分支则采用哈达玛德积注意力机制,沿空间-通道多维度增强特征关联性。解码器引入的GMCA模块通过分组多头交叉注意力实现跨分支特征融合,形成全局-局部互补机制。

**FSMF分支**的核心在于频谱特征解耦。通过快速傅里叶变换(FFT)将图像转换至频域,分离振幅(反映整体亮度分布)与相位(捕捉局部细节)信息。例如,高振幅区域对应肿瘤核心区域,而相位信息则能有效增强边缘检测能力。该模块特别针对CT图像低对比度问题,通过频域增强策略显著改善小病灶的可见性。

**MAHA分支**采用轻量级哈达玛德积注意力机制,沿三个轴(高度-宽度、通道-高度、通道-宽度)动态分配权重。与传统全连接注意力相比,哈达玛德积通过元素级乘法降低计算复杂度,同时引入相对位置编码增强空间感知。例如,在肿瘤边界模糊场景中,该模块能通过跨通道特征对比强化边界锐化效果。

**GMCA模块**通过分组特征聚合实现跨模态融合。具体而言,将输入特征按通道分组后,分别进行多尺度特征提取(如3×3卷积+空洞卷积)与跨分支注意力交互。这种设计既保留了频谱特征的全局性,又整合了空间特征的具体形态,同时通过分组机制将计算量控制在合理范围。

### 二、实验设计与对比分析
在LiTS2017和3DIRCADb两个公开数据集上,DGA-Net与当前SOTA方法(如PVTFormer、AGCAF-Net)进行对比测试。实验表明,DGA-Net在肝组织分割的Dice-per-case(DPC)达到94.84%,肿瘤分割DPC达69.51%,分别超越对比方法0.72%和1.68%。在关键评价指标HD95(边界95%对应点最大距离)中,DGA-Net的肝组织分割HD95为2.80毫米,肿瘤分割为9.77毫米,均优于其他模型。

**性能优势解析**:
1. **边界精度提升**:通过频谱学习增强的振幅-相位联合特征,可有效识别肿瘤边缘的亮度渐变与结构细节。MAHA模块的多轴注意力机制则能捕捉边界区域的空间拓扑关系,例如肿瘤与肝包膜接触区域的环形特征。
2. **小病灶检测优化**:FSMF分支通过频域放大策略,将低对比小病灶的幅值差异增强2-3倍。实验显示,直径<2厘米的肿瘤DPC提升达3.6%,且ASSD(对称表面距离)降低至10.80毫米,较传统方法减少约18%。
3. **计算效率显著改善**:DGA-Net参数量仅1.39M,而对比模型如PVTFormer达45.05M。在RTX 3090 GPU上,单层推理时间较nnUNet减少23%,全数据集处理时间缩短至原方法的1/3。

### 三、关键模块贡献度验证
通过模块消融实验,各组件贡献度如下:
- **FSMF分支**:在肿瘤分割中贡献度达32%,其频谱特征对提升小病灶检测敏感度至关重要。
- **MAHA模块**:减少跨通道计算量约65%,同时提升肿瘤边界清晰度(HD95降低12%)。例如,在多中心临床试验中,MAHA分支对血管干扰的鲁棒性提升达27%。
- **GMCA模块**:引入跨分支特征交互后,DPC整体提升8.19%,尤其在肝组织与肿瘤交叠区域(如门静脉周围)表现突出。

### 四、临床应用价值与局限性
**应用场景**:
- **术前规划**:通过高精度肿瘤分割生成3D重建模型,辅助制定个性化手术方案。实验显示,DGA-Net的肿瘤体积误差RAVD仅0.386%,适用于MRI与CT影像的跨模态分割。
- **术中导航**:实时推理时间(0.082秒/层)满足术中动态调整需求,且在10%-20%的GPU内存占用下仍保持稳定性能。
- **疗效评估**:基于分割结果的体积变化(RAVD)与表面误差(ASSD)指标,可客观量化治疗响应。

**局限性分析**:
- **3D信息利用不足**:当前模型为2D架构,未充分挖掘CT多切片特征。后续研究计划引入3D注意力机制,提升跨切片肿瘤检测能力。
- **噪声敏感性问题**:在CT图像中,高斯噪声(σ>0.5)会导致DPC下降约5%,需通过数据增强或自适应降噪模块进一步优化。
- **计算资源依赖**:尽管参数量较低,但MAHA模块的并行计算仍需NVIDIA GPU支持,未来需开发轻量化推理引擎。

### 五、技术启示与未来方向
本研究揭示了三个技术方向对分割模型性能的提升路径:
1. **频谱-空间特征协同**:结合傅里叶变换的频域特征与注意力机制的空间建模能力,可显著改善低对比度组织的分割效果。
2. **动态分组聚合策略**:通过特征分组与模块化交互,在保证性能的同时将参数量压缩至传统模型的15%-20%。
3. **轻量化注意力设计**:哈达玛德积注意力机制相比全连接注意力减少60%计算量,为医学影像模型的实时部署提供可能。

未来工作将重点解决以下问题:
- **多模态融合**:整合MRI的T2加权像与CT的解剖结构信息,提升复杂病例的分割鲁棒性。
- **可解释性增强**:通过注意力权重可视化,辅助医生理解模型决策依据。
- **自适应计算**:开发硬件感知的动态计算框架,在GPU与边缘设备间实现性能自适应。

### 六、结论
DGA-Net通过双分支协同架构与轻量化注意力机制,在保持高分割精度的同时显著降低计算成本。其实验结果表明,该模型在肝组织分割中达到94.84%的DPC,肿瘤分割达69.51%,且在跨数据集(LiTS2017→3DIRCADb)测试中表现稳定,验证了其泛化能力。这种技术特性使其特别适用于资源受限的基层医疗机构,同时为3D扩展与多模态融合奠定了基础。后续研究将聚焦于临床场景验证与计算效率优化,目标实现实时三维分割(<50ms/ slice)与端到端部署(<500MB内存)。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号