混合神经网络架构用于基于集成学习的CT图像自动肝脏和肿瘤分割

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Biomimetics》：Hybrid Neural Network Architecture for Automated Liver and Tumor Segmentation Using Ensemble Learning on CT Images

【字体：大中小】 时间：2026年06月09日 来源：Biomimetics 3.9

编辑推荐：

　　从计算机断层扫描（CT）图像中准确且自动地分割肝脏和肝脏肿瘤对于计算机辅助诊断、治疗计划和临床决策至关重要。尽管基于深度学习的分割模型，特别是U-Net及其变体，在医学图像分析中取得了有希望的结果，但许多现有方法主要关注局部像素级特征提取，可能在显式建模解剖学

从计算机断层扫描（CT）图像中准确且自动地分割肝脏和肝脏肿瘤对于计算机辅助诊断、治疗计划和临床决策至关重要。尽管基于深度学习的分割模型，特别是U-Net及其变体，在医学图像分析中取得了有希望的结果，但许多现有方法主要关注局部像素级特征提取，可能在显式建模解剖学有意义区域间的长程空间关系方面能力有限。此外，由于CT图像中的低对比度、不规则肿瘤边界、异质性肿瘤外观以及噪声或伪影，肝脏肿瘤分割仍然具有挑战性。为了解决这些局限性，本研究提出了一种混合集成神经网络架构，该架构整合了改进U-Net和图U-Net（Graph U-Net），用于自动肝脏和肝脏肿瘤分割。改进U-Net旨在通过带有跳跃连接的编码器-解码器结构捕获细粒度局部特征并保留详细的空间信息，而图U-Net则使用基于简单线性迭代聚类（SLIC）的超像素构建CT图像的图表示，并建模相邻图像区域之间的空间依赖性。通过集成学习策略组合这些互补表示，所提出的框架增强了像素级分割准确性和对噪声成像条件的鲁棒性。该方法在LiTS17数据集上进行了评估，其中CT图像经过强度滤波、调整大小、数据增强和归一化预处理。实验结果表明，所提出的集成架构在肝脏分割上达到99.2%的准确率，在肝脏肿瘤分割上达到98.1%的准确率，优于代表性分割模型如MultiresUnet和R2U-Net。此外，不同信噪比条件下的鲁棒性实验表明，所提出模型在噪声CT图像中保持稳定性能，即使在-4 dB SNR的严重噪声下也达到85%的准确率。这一结果突显了将卷积特征学习与基于图的空间关系建模相结合的优势，可在图像质量因噪声或伪影下降时提高分割稳定性。这些发现表明，改进U-Net、基于SLIC的图构建和图U-Net的整合为肝脏和肝脏肿瘤分割提供了一种有效且噪声鲁棒的解决方案，在经过更大规模和外部数据集的进一步验证后，具有作为临床图像分析中计算机辅助工具的潜在适用性。

**论文解读：基于混合集成神经网络的CT图像肝脏与肿瘤自动分割**
肝脏作为人体重要器官，位于右肋骨下方并毗邻下肺，参与消化、营养储存和血细胞过滤等生理过程。肝细胞癌（一种常见的肝癌类型）由肝细胞快速失控生长引起，已成为全球性健康问题，男性感染率约为女性两倍。根据世界卫生组织（WHO）数据，2015年癌症导致880万人死亡，其中肝癌贡献78.8万例；美国癌症学会（ACS）报告美国每年约4.07万例新发肝癌和胆管癌病例。计算机断层扫描（CT）成像因能提供详细的三维解剖图像而被视为最有效的检测方法之一，但肝形状和纹理的变异性、肝与邻近组织的低对比度以及CT伪影的存在，使得肿瘤识别面临挑战。现有基于深度学习的U-Net及其变体虽在医学图像分割中取得进展，但主要聚焦局部像素级特征提取，对解剖学有意义区域间的长程空间关系建模能力有限；同时，在低对比度、不规则边界、异质性外观及噪声条件下，肿瘤分割性能仍不理想。因此，研究人员提出一种混合集成神经网络架构，整合改进U-Net和图U-Net（Graph U-Net），以同时捕获局部像素级细节和区域级空间依赖，提升分割准确性和噪声鲁棒性。该研究在LiTS17数据集子集上验证，肝脏和肿瘤分割准确率分别达99.2%和98.1%，且在-4 dB SNR噪声下仍保持85%准确率，表明该方法在计算机辅助临床图像分析中具有潜力。论文发表在《Biomimetics》。

**关键技术方法**（不超过250字）
研究人员采用以下关键方法：①改进U-Net：编码器路径逐步加深卷积层数（1→2→3→4个连续卷积层），使用3×3卷积核和最大池化，解码器通过转置卷积恢复空间分辨率，跳跃连接保留细粒度特征。②图U-Net：基于SLIC（简单线性迭代聚类）算法将CT图像转换为超像素图，每个超像素作为图节点，相邻超像素间以加权边连接，通过图卷积层（GCN）建模空间依赖性。③集成融合：加权融合改进U-Net和图U-Net的概率图，超参数α通过验证集选择；联合优化三个Dice损失项（各分支及集成输出）。数据来自LiTS17数据集中的9个CT体积（共987张训练图像），预处理包括强度滤波（[0,150] Hounsfield单位）、重采样至256×256、数据增强（水平/垂直翻转、0~30度旋转）及归一化（[0,1]）。

**研究结果**
**4.1 定量分割性能（Quantitative Segmentation Performance）**
通过Dice损失和准确率曲线分析，发现集成网络在肝脏分割中需约380次迭代收敛，图U-Net和改进U-Net的Dice损失更低且更稳定。肝脏分割准确率曲线显示集成模型持续优于单个模型。对于肝脏肿瘤分割，集成网络约340次迭代后收敛，损失显著降低，准确率曲线证实其优越性。训练和测试准确率曲线表明模型在训练和未见数据上均保持高性能。表4显示，集成方法在肝脏分割上获得99.2%准确率、99.3%敏感性、90.80%Dice系数和89.10%平均交并比（mean-IoU）；肝脏肿瘤分割上获得98.1%准确率、98.4%敏感性、90.30%Dice系数和88.90% mean-IoU。表5表明，增加SLIC超像素数量（20和30个）可提升准确率和Dice系数。图11显示前向路径步数优化中，4步（含4次最大池化）配置在计算效率和分割精度间取得最佳权衡。表6的超参数敏感性分析显示，学习率1×10??、批大小8、训练轮次100、图卷积层数3时性能最优；增加层数超过3层可能导致图表示过平滑。

**4.2 讨论（Discussion）**
图12和表7展示了不同信噪比（SNR）条件下的噪声鲁棒性：在-4 dB、0 dB、5 dB、10 dB及无噪声条件下，集成网络分别达到85%、90%、93%、96%和99.2%的准确率，表明其在严重噪声下仍保持稳定。表8扩展比较了近期分割模型（包括SBM–Attention U-Net、Improved SwinUNet、DiNA-SwinUNet、RMAU-Net等），在所选的LiTS17子集上，集成方法在肝脏和肿瘤分割的准确率和敏感性上具有竞争力。临床相关性方面，99.2%和98.1%的准确率表明该框架有潜力支持计算机辅助肝图像分析，但不可替代放射科医师，需在更大外部数据集及真实临床流程中进一步验证。局限性包括：实验基于LiTS17的9个CT体积（987张图像），样本量较小可能限制泛化性；未在3DIRCADB等独立数据集上进行跨数据集验证；集成架构引入额外计算和内存开销。未来工作应使用完整LiTS17数据集、多中心队列和外部数据集评估，并探索轻量化策略（如剪枝、知识蒸馏、混合精度训练）。

**结论部分翻译**
所提出的集成网络，结合了改进U-Net和图U-Net架构，展示了对CT图像进行肝脏和肝脏肿瘤分割的一种高效方法。通过仔细的预处理，包括图像增强和归一化，该系统在分割肝脏和肝脏肿瘤方面取得了显著性能，准确率分别达到99.2%和98.1%。先进技术的整合，如用于图构建的SLIC以及在U-Net中使用多层卷积策略，确保了检测详细解剖特征的精度。此外，该网络的鲁棒性通过其在噪声环境下的性能得到验证，优于其他最先进方法，突显了其在临床环境中的实际适用性。总体而言，所提出的方法为医学图像分割任务提供了一种高效且可靠的解决方案，在变化条件下兼具高准确性和韧性。

联系信箱：

粤ICP备09063491号

热点排行