
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于混合网络的鼻窦炎CT图像分割性能比较研究:CNN、ViT与混合架构的精准解剖定位突破
【字体: 大 中 小 】 时间:2025年09月02日 来源:Scientific Reports 3.9
编辑推荐:
本研究针对鼻窦炎患者CT图像中鼻旁窦(FS/ES/SS/MS)的精准分割难题,系统比较了卷积神经网络(CNN)、视觉Transformer(ViT)和混合网络(Swin UNETR/CoTr)的性能。研究发现混合网络在Jaccard指数(0.719)、Dice系数(0.830)等关键指标上显著优于传统方法,尤其能降低关键手术标志物附近的分割误差,为鼻窦炎影像导航手术(IGS)和3D容积分期提供了更优的算法选择。
鼻窦作为人体重要的解剖结构,不仅参与温度调节和面部保护,其炎症病变——鼻窦炎更是困扰全球约10%人口的常见疾病。当鼻窦黏膜发生慢性炎症(CRS)时,会导致黏膜增厚、骨质重塑等复杂病理改变,这些变化在CT图像上呈现高度异质性。传统依赖人工勾画的鼻窦分割方法效率低下,而现有自动分割算法在应对鼻窦复杂的空间构型(如筛窦ES的蜂窝状结构)和炎症导致的形态学变异时表现欠佳。更关键的是,鼻窦与视神经、颅神经等关键结构的紧密相邻,使得分割误差可能直接影响内窥镜鼻窦手术(ESS)的安全性和图像引导手术(IGS)系统的准确性。这些临床痛点促使Dahyun Song团队在《Scientific Reports》发表研究,系统评估不同深度学习架构在鼻窦分割中的表现。
研究采用200例鼻窦炎患者CT数据(176例患者/24例正常对照),通过两名耳鼻喉科专家手动标注建立金标准。主要技术方法包括:1)使用3D U-Net、V-Net代表CNN架构,VT-UNet、D-Former代表ViT架构,Swin UNETR和CoTr作为混合网络;2)采用Jaccard指数(JI)、Dice相似系数(DSC)、95% Hausdorff距离(HD95)等6项指标评估性能;3)通过参数规模(Params)和推理时间(IT)评估计算效率;4)统计方法采用重复测量ANOVA和Bonferroni校正。
【Comparison of segmentation performance】章节显示,混合网络在整体性能上实现突破:Swin UNETR以15.7M参数量获得最优分割指标(JI=0.719,DSC=0.830),其HD95值(10.529)显著低于ViT架构(p<0.05)。CoTr则展现出最快的推理速度(0.149秒/体积),适合实时临床应用。
【Results】部分通过解剖复杂度分层分析发现:1)在上颌窦MS(解剖最简单区域),所有网络DSC>0.85;2)在筛窦ES(最复杂区域),Swin UNETR的DSC(0.783)显著优于CNN和ViT(p<0.05);3)边界分析显示混合网络能更好区分额窦FS-筛窦ES交界处等手术关键区域(图4白色箭头示)。

【Discussion】部分指出三大发现:1)CNN在筛窦区域易出现欠分割(假阴性),源于其局部感受野限制;2)ViT在蝶窦SS易产生过分割(假阳性),与全局注意力机制丢失局部细节有关;3)混合网络通过Swin Transformer的窗口注意力机制和CNN的局部特征提取,在保持参数效率的同时实现最优边界描绘(图5红/蓝圈示)。

该研究的临床意义在于:1)为鼻窦炎容积分期(如Lund-Mackay评分系统)提供自动化工具;2)通过精确识别前筛动脉等手术标志物(图4棕色箭头处),提升ESS手术导航安全性;3)Swin UNETR的小参数量特性(15.7M)使其更适合医疗资源有限场景部署。作者也指出需通过多中心验证解决单机构数据局限性的问题,未来可探索这些算法在增强现实导航系统中的应用价值。
生物通微信公众号
知名企业招聘