《Scientific Reports》:Automated segmentation of COVID-19 lesions in CT scans using attention U-net with hybrid loss functions
编辑推荐:
本研究针对COVID-19肺部CT影像中病灶对比度低、分割难度大的问题,提出了一种结合CLAHE预处理、注意力U-Net架构和混合Dice-Tversky损失函数的自动分割框架。通过5折交叉验证,模型在公开数据集上达到Dice分数0.83、IoU 0.71的优异性能,并结合Grad-CAM可视化技术增强模型可解释性,为COVID-19精准诊疗提供可靠工具。
当新冠肺炎(COVID-19)疫情在全球蔓延时,快速准确的诊断成为防控的关键。虽然逆转录聚合酶链反应(RT-PCR)是常用的检测方法,但其检测速度较慢且存在较高假阴性率。计算机断层扫描(CT)成像技术因其非侵入性和高分辨率,成为辅助诊断COVID-19的重要工具。然而,医生需要人工审阅大量CT图像,过程耗时且易受主观因素影响。特别是COVID-19引起的肺炎病灶在CT影像中常表现为低对比度、形态不规则的特征,这使得自动化分割极具挑战。
为了解决上述问题,来自沙特阿拉伯Prince Sattam bin Abdulaziz大学与埃及Sohag大学的研究团队在《Scientific Reports》上发表了一项研究,提出了一种基于注意力U-Net(Attention U-Net)结合混合损失函数的自动分割方法,用于精准识别COVID-19患者的肺部感染区域。
该研究整合了多个关键技术环节:首先采用对比度受限自适应直方图均衡化(CLAHE)对CT图像进行预处理,以增强病灶区域的视觉显著性;随后构建了一种轻量级的注意力U-Net模型,通过引入注意力门控(Attention Gate)机制,使网络能够聚焦于感染区域,抑制无关背景信息;在损失函数设计上,结合Dice损失与Tversky损失,赋予假阴性更高权重,从而提升对小病灶的识别能力;此外,研究还采用了包括旋转、缩放、亮度调整等在内的多种数据增强策略,有效提升模型泛化能力。所有实验基于公开的COVID-19 CT病灶分割数据集,包含2,729张图像-掩码对,采用5折交叉验证进行评估。
模型架构设计
研究团队在经典U-Net结构基础上进行多项改进:编码器部分采用可分离卷积降低计算复杂度,解码器部分使用转置卷积进行上采样,并在跳跃连接中嵌入注意力门控模块,通过生成注意力系数图突出重要特征。该设计能有效缩小编码器与解码器之间的语义差距,提升病灶边界的定位精度。
损失函数组合
为应对COVID-19病灶与正常组织间的类别不平衡问题,作者提出混合损失函数,结合Dice相似系数(DSC)与Tversky指数(TI),其中TI通过调整α=0.7、β=0.3的权重参数,加强对假阴性样本的惩罚,从而提高模型对小病灶的敏感性。
实验结果与分析
通过5折交叉验证,该模型在测试集上达到平均Dice分数0.8297、交并比(IoU)0.7089、准确率99.50%的性能。与其他先进方法相比,如STCNet(Dice=0.80)和D2A U-Net(Dice=0.73),本研究提出的框架在分割精度上表现更优。此外,训练过程中的损失曲线和Dice分数曲线显示模型收敛稳定,未出现明显过拟合。
可解释性分析
为进一步增强临床可信度,研究采用梯度加权类激活映射(Grad-CAM)对模型决策过程进行可视化。热力图显示模型注意力主要集中在感染区域,与专家标注的ground truth高度一致,有效验证了其决策合理性。
讨论与展望
尽管本研究在COVID-19病灶分割任务中取得了良好效果,但仍存在一定局限性。例如,数据集仅包含COVID-19相关肺炎影像,未涵盖其他类型肺部病变;图像分割以切片为单位而非患者为单位,可能高估模型泛化能力。未来工作将考虑引入多中心数据集验证、开展消融实验评估各模块贡献,并探索基于Transformer的基础模型(如Segment Anything Model)在该任务上的潜力。
综上所述,该研究通过系统整合CLAHE预处理、注意力机制与混合损失函数,构建了一个高效、可解释的COVID-19肺部CT病灶分割框架,不仅在技术上实现了先进的分割性能,也为临床辅助诊断提供了可靠工具,具有重要的科研与临床应用价值。