FFB-Former:一种用于膀胱镜检查图像分割的快速扁平化分支变换器
《Biomedical Signal Processing and Control》:FFB-Former: Flatten Faster Branch Transformer for cystoscopy segmentation
【字体:
大
中
小
】
时间:2025年10月31日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
本研究提出FFB-Former模型,通过整合Flatten Transformer增强全局特征提取,重构FastNet Conv Branch捕获精细形态,结合Partial Convolution和SCConv优化边界分割,在自建BC-DB数据集上mDice达0.904,跨领域评估于Kvasir-SEG和CVC-ClinicDB分别达到0.962和0.960,显著优于基线方法。摘要字数:109字
膀胱癌是一种常见的泌尿系统恶性肿瘤,其诊断和治疗在临床实践中起着至关重要的作用。根据美国癌症协会的统计,2023年美国预计会有约82,290例新的膀胱癌病例,并有约16,710人因该病去世。在临床诊疗过程中,医生通常依赖于对膀胱壁的分层以及对肿瘤的分期来制定治疗方案。其中,高分级的T1期膀胱癌属于非肌层浸润性膀胱癌,具有较高的复发和进展风险,其五年复发率和进展率分别达到42%和20%–40%。尽管这些数据令人担忧,但膀胱癌的生存率在所有癌症中相对较高。如果癌症早期被发现且局限于膀胱内,94%的患者能够成功接受治疗并存活。然而,对于晚期检测的患者,生存率则显著下降,仅约为6%。因此,准确识别和分割肿瘤的位置与大小,对于早期诊断、辅助治疗决策以及降低患者的发病率和死亡率具有重要意义。
目前,膀胱肿瘤的治疗过程通常包括影像学检查、内窥镜检查以及经尿道膀胱肿瘤切除术(TURBT)。影像学技术如磁共振成像(MRI)和计算机断层扫描(CT)在临床中广泛应用,但这些技术属于组织学检查,而内窥镜和TURBT则使用的是视觉表面筛查方法。视觉表面筛查相较于组织学检查具有显著优势,尤其是在实时性方面,能够在内窥镜检查过程中即时分析图像,提高诊断效率。此外,视觉表面筛查的成本也相对较低,这使得其在多种医疗环境中更具可行性。对于早期发现和患者长期随访,这种方法尤为适用,有助于及时检测和治疗肿瘤。
然而,这些图像中存在噪声、模糊、低对比度、形态多样性以及透视变化等问题,使得膀胱肿瘤图像的分割任务变得极具挑战性。在这些情况下,一种安全且有效的方法是内窥镜检查,这是一种用于观察和治疗膀胱及尿道的内窥镜技术。医生可以通过内窥镜直接观察病变区域,从而帮助诊断和治疗血尿、尿路感染、膀胱肿瘤、膀胱结石、前列腺增生等疾病。内窥镜活检是诊断膀胱癌的黄金标准,也是术后监测复发的主要工具。经尿道膀胱肿瘤切除术(TURBT)既是膀胱癌的主要诊断方法,也是其主要的治疗方法。目前,TURBT是治疗非肌层浸润性膀胱癌的黄金标准。
这是因为在进行内窥镜和TURBT的过程中,会产生白光图像。研究表明,常用的白光内窥镜检查在膀胱癌检测中的准确率在68%至79.2%之间。同时,所有膀胱癌病例的三分之二费用来自于广泛的TURBT和内窥镜检查。因此,利用内窥镜准确识别膀胱肿瘤变得尤为重要。
近年来,深度学习作为一种强大的机器学习技术,在自然和医学图像分析方面取得了显著进展。深度学习能够从大量数据中自动学习高阶特征表示,从而提高肿瘤图像分割的准确性和鲁棒性。在膀胱肿瘤医学图像分割的研究中,当前主要关注的是CT图像。然而,由于缺乏公开的白光内窥镜膀胱肿瘤数据集,使得深度学习在该领域的应用受到一定限制。
为此,我们与安徽医科大学泌尿外科合作,构建了一个高质量的白光内窥镜膀胱肿瘤数据集(BC-DB),用于支持模型的开发和评估。同时,我们也关注到现有的一些数据集在处理膀胱肿瘤图像时的局限性,因此,构建一个全面且准确的数据集对于提升模型的性能具有重要意义。该数据集不仅包含了大量白光内窥镜图像,还通过泌尿科专家的标注确保了数据的可靠性。此外,我们特别注意保护患者的隐私,确保数据在使用过程中不会泄露。
为了验证FFB-Former的迁移性能,我们将其应用于流行的结肠镜分割基准数据集Kvasir-SEG和CVC-ClinicDB。实验结果显示,FFB-Former在这些数据集上的表现非常接近当前最先进的方法。这表明该模型不仅在特定的膀胱肿瘤图像分割任务中表现出色,还具备良好的泛化能力,能够适应不同领域的图像分割需求。
当前,在深度学习与内窥镜膀胱肿瘤图像分割的结合中,存在三大关键问题:首先,区分肿瘤与正常组织是内窥镜检查中的一个难点。在进行此类检查时,肿瘤组织与正常组织的区分往往较为困难;其次,膀胱肿瘤的形态多样,包括结节状、菜花状、分叶状或不规则状等,且肿瘤大小各异,甚至存在小面积或不连续分布的情况,这种形态的多样性增加了图像分割的复杂性,可能导致漏检;第三,膀胱肿瘤的边界模糊。在膀胱癌图像中,肿瘤与周围正常组织之间的对比度较低,或者肿瘤形态复杂,使得肿瘤边界的准确识别变得困难。
为了应对这些问题,我们提出了FFB-Former这一先进的神经网络架构,专门用于白光内窥镜图像中的膀胱肿瘤分割。该模型通过整合Flatten Transformer来增强全局特征提取能力,从而提高肿瘤的识别和区分效果。同时,我们引入了重构后的FastNet卷积分支(FCB),以更好地捕捉肿瘤的细节形态。此外,通过引入部分卷积(PConv)和空间与通道重构卷积(SCConv),FFB-Former能够更精确地进行边界优化,从而实现多尺度上下文信息的融合。
在模型设计过程中,我们特别关注了如何提高分割的准确性与效率。Flatten Transformer的引入使得模型能够更有效地提取全局特征,从而增强对肿瘤与正常组织的区分能力。而重构后的FastNet卷积分支则有助于模型更好地识别不同形状的肿瘤,特别是那些小面积或不连续分布的肿瘤。同时,通过PConv和SCConv的结合,模型能够在减少计算量的同时,提高分割的精度。
FFB-Former的构建基于现有的深度学习技术,并在此基础上进行了创新。通过结合Flatten Transformer和FastNet卷积分支,该模型在保持高效计算的同时,提升了对肿瘤的识别能力。同时,我们通过与安徽医科大学泌尿外科的合作,构建了一个高质量的白光内窥镜膀胱肿瘤数据集(BC-DB),为模型的训练和验证提供了坚实的基础。该数据集不仅包含了大量图像,还通过专家标注确保了数据的准确性,为后续研究提供了宝贵的资源。
在实验评估中,FFB-Former在BC-DB数据集上取得了优异的分割性能,其mDice达到0.904,mIoU达到0.842,分别比基线方法高出2%和3%。在跨域评估中,FFB-Former在Kvasir-SEG和CVC-ClinicDB数据集上的表现也优于现有方法,mDice分别为0.962和0.960,分别比现有方法高出0.7%–2%。这些结果验证了FFB-Former在临床膀胱癌图像分析中的鲁棒性和泛化能力。
总体而言,FFB-Former的提出不仅解决了膀胱肿瘤图像分割中的多个技术难题,还为临床实践提供了新的工具。通过结合Flatten Transformer和FastNet卷积分支,该模型能够更高效地提取特征并进行分割。同时,引入PConv和SCConv使得模型在减少计算量的同时,提高了分割的精度。这些技术的结合,使得FFB-Former在处理复杂医学图像时表现出色。
此外,FFB-Former的构建也体现了深度学习在医学图像分析中的重要性。通过与泌尿外科专家的合作,我们不仅获得了高质量的图像数据,还确保了数据的准确性与可靠性。这为后续的模型训练和验证提供了坚实的基础。同时,我们也认识到,在医学图像分析中,数据的多样性和复杂性是影响模型性能的重要因素。因此,构建一个全面且高质量的数据集对于提升模型的泛化能力具有重要意义。
在深度学习的发展过程中,从早期的卷积神经网络(CNNs)到近期的Transformer架构,各种模型不断涌现并取得了显著进展。早期的CNNs,如U-Net,通过引入跳跃连接来结合低阶和高阶特征,大大提高了分割的准确性。后续的模型如Fast R-CNN和Mask R-CNN则进一步提升了目标检测和实例分割的能力。近年来,基于CNN的模型如DoubleU-Net和MSRF-Net通过多尺度特征融合和残差连接,进一步提升了性能,有效应对了生物医学图像分割的复杂性。
Transformer架构的出现为医学图像分割带来了新的机遇。例如,Polyp-PVT通过金字塔视觉Transformer在特定任务如息肉分割中展示了其多尺度特征提取的能力。TransUNet成功地结合了Transformer和U-Net的优势,使用Transformer作为强大的编码器,同时保留了U-Net的解码器结构。这种混合方法在各种医学图像分割任务中表现优异。
这些技术的不断进步,使得医学图像分割领域进入了新的发展阶段。每种模型都带来了独特的创新,例如SegFormer通过将分层Transformer编码器与轻量级MLP解码器结合,实现了高效的模型设计。这些发展为解决复杂的医学图像分割问题提供了丰富的工具,包括膀胱肿瘤的分割。
尽管现有的模型如Fully Convolutional Branching Transformer(FCBFormer)在医学图像分割中表现良好,但在处理膀胱肿瘤的特定需求时仍存在不足。为此,我们提出了FFB-Former这一新的模型架构,不仅对现有技术进行了改进,还针对膀胱肿瘤的分割任务进行了专门设计。通过引入Flatten Transformer、重构FastNet卷积分支以及结合PConv和SCConv,FFB-Former在解决肿瘤与正常组织的区分、识别多样形态的肿瘤以及优化模糊边界等方面表现出色。
在模型的构建过程中,我们特别关注了如何提高分割的准确性与效率。Flatten Transformer的引入使得模型能够更有效地提取全局特征,从而增强对肿瘤与正常组织的区分能力。而重构后的FastNet卷积分支则有助于模型更好地识别不同形状的肿瘤,特别是那些小面积或不连续分布的肿瘤。同时,通过PConv和SCConv的结合,模型能够在减少计算量的同时,提高分割的精度。
此外,FFB-Former的构建还体现了深度学习在医学图像分析中的重要性。通过与安徽医科大学泌尿外科的合作,我们不仅获得了高质量的图像数据,还确保了数据的准确性与可靠性。这为后续的模型训练和验证提供了坚实的基础。同时,我们也认识到,在医学图像分析中,数据的多样性和复杂性是影响模型性能的重要因素。因此,构建一个全面且高质量的数据集对于提升模型的泛化能力具有重要意义。
综上所述,FFB-Former的提出不仅解决了膀胱肿瘤图像分割中的多个技术难题,还为临床实践提供了新的工具。通过结合Flatten Transformer和FastNet卷积分支,该模型能够更高效地提取特征并进行分割。同时,引入PConv和SCConv使得模型在减少计算量的同时,提高了分割的精度。这些技术的结合,使得FFB-Former在处理复杂医学图像时表现出色。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号