肝脏疾病每年导致两百万人死亡,其中肝硬化是主要死因(De Franchis等人,无日期;Sun等人,2023年)。像肝硬化这样的疾病会导致门脉血流异常增加和门脉压力持续升高。门脉高压进一步引发广泛的侧支循环形成(De Franchis,2015年)。上消化系统的静脉与门脉系统紧密相连,其结构和外观直接受到门脉高压的影响。它们的临床表现对临床诊断和治疗至关重要。例如,食管和胃静脉曲张是由门脉高压引起的并发症,如果破裂可能会非常危险甚至致命。
腹部增强门脉静脉期CT图像是诊断门脉高压患者静脉病变的主要方法。本研究中的上消化道静脉区域包括食管和腔外静脉曲张、胃底静脉曲张、肝门静脉、脾门静脉和肠系膜上静脉,以及由于门脉高压形成的侧支循环血管。这些区域统称为上消化道静脉(UDV),对这些区域中的静脉血管进行精确和快速的体素级自动分割将有助于临床诊断、治疗计划和预后。
目前,深度学习技术在血管分割任务中发挥着重要作用。基于卷积神经网络(CNN)的U-Net(Ronneberger等人,2015年)是血管分割的主要方法。在U-Net中加入跳跃连接可以将编码器特征图与相应的解码器特征图合并。这种在不同尺度上的特征融合有助于恢复更精确的图像边缘和细节。Yu等人(2019年)将残差块集成到3D U-Net中,用于分割肝静脉和门静脉。LVSNet(Yan等人,2021年)在U-Net中加入了注意力引导模块(AGC),利用高级特征的注意力来指导低级特征并捕捉更多血管细节。Gao等人(2023年)在U-Net中引入了拉普拉斯显著性门控滤波器。在融合多尺度特征后,对这些特征进行过滤以增强血管区域,同时抑制肝脏的其他区域。然而,由于感受野有限和权重共享的平移等变性,卷积网络主要捕捉局部模式,这可能阻碍长距离依赖关系的建模。
视觉变换器(ViT)(Dosovitskiy等人,2021年)将输入图像分割成一系列补丁,利用自注意力的强大长距离依赖关系建模能力来增强对图像的整体感知。然而,Transformer的大量训练参数依赖于较大的训练数据集,这在医学成像领域可能难以获得。因此,许多研究正在探索使用Transformer来建立CNN提取的局部特征之间的长距离连接,旨在创建结合CNN和Transformer优势的网络。Yu等人(2022年)将通道注意力视觉变换器(CAViT)集成到U-Net的跳跃连接中,以利用通道特征之间的相互依赖性来增强对胃底血管关键边缘结构的提取。Xu等人(2024年)引入了双流编码器,将CNN编码与Swin Transformer编码合并。Transformer分支用于建立目标之间的相对位置关系,创建补丁之间的连接,并扩大感受野;CNN分支捕捉局部特征并提高对小血管的敏感性,从而改善肝静脉和门静脉的分割效果。Li等人(2023年)使用U-Net作为胃底血管分割的骨干网络。他们用Transformer替换了瓶颈层,以结合长距离依赖关系进行综合建模。此外,他们还将局部注意力集成到跳跃连接中,以改善边缘细节。
然而,现有方法在分割UDV区域时存在两个缺陷:1)对于小血管结构,预测结果为假阴性。一些方法对于在真实情况下应该是连续的微小血管产生碎片化的分割结果,而其他模型则直接产生阴性结果,如图1(b)所示。2)对于金属器械,产生假阳性结果。如图1(c)所示,红色箭头指示的金属器械的CT值与门脉静脉期增强CT图像上的静脉CT值相似,导致模型对此器械产生假阳性结果,并错误地将其识别为目标血管。
为了解决UDV区域的复杂性,使用经典图像处理算法获取血管先验是必要的。然后,本文提出了一种结合CNN和Transformer的新混合框架,该框架集成了血管先验和空间感知能力,用于门脉高压患者的UDV精确分割。首先,具有金字塔结构的CNN编码器从输入的3D图像中提取多尺度特征。随后,血管注意力模块计算Hessian矩阵,并应用Frangi等人(1998年)的血管性滤波器到多尺度特征图上,结合关于血管的先验知识来过滤掉非管状区域,增强模型对各向异性血管的感知。最后,视觉变换器连接CNN编码器和解码器的相应阶段。体素位置编码(VPE)模块提高了Transformer的位置感知能力,并增强了血管连通性。VPE模拟了全局空间位置信息,有助于提取网络的深层语义特征,并有效解决了血管中断的问题。
我们的贡献总结如下:
1)我们提出了一种新颖的UDV分割网络,有效融合了传统图像处理技术(例如Frangi滤波)和CNN及Transformer的优势。该网络能够在增强CT上实现端到端的、完全自动的体素级上消化道静脉分割。
2)我们提出了一种血管注意力模块,结合了血管先验和多尺度特征,以增强模型对各向异性血管的感知。
3)我们提出了一种具有VPE的空间感知Transformer,提高了空间定位性能并保持了血管连续性,从而减少了假阴性和假阳性检测结果。
4)我们收集并构建了一个新的腹部增强门脉静脉期CT图像数据集,来自门脉高压患者(PHCT)。我们专业地标注了191张CT图像,以描绘上消化道静脉血管,从而支持血管分割方法的训练和验证。