FVFDSDG:基于频率视角特征解耦与插值的医学图像单源域泛化新框架
【字体:
大
中
小
】
时间:2025年10月11日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
本文提出了一种创新的单源域泛化框架FVFDSDG(Frequency View Feature Interpolation and Disentanglement for Single-Source Domain Generalization),通过频率多视角特征解耦、结构频率视角插值(SFVI)策略和注意力机制,有效解决了医学图像分割中的域偏移(Domain Shift)问题。该方法在单一源域训练条件下,在四个目标域上实现了Dice系数最高提升12%的SOTA性能,显著增强了模型在眼底图像分割任务中的跨域泛化能力。
领域泛化(Domain Generalization, DG)旨在利用多个源域数据训练模型,减少模型在未见域中的性能衰减,从而提升其在新域中的鲁棒性和泛化能力。常用方法包括图像级数据增强(Data Augmentation)和特征级解耦技术(Disentanglement Techniques)。
本文提出了一种解决单源域泛化(Single-Source Domain Generalization, SDG)问题的新方法。训练集表示为:DS = {(xSi, ySi) | i = 1, 2, …, nS},其中xSi是来自源域的第i个样本,ySi是其真实标签,nS是源域训练样本的数量。目标是最小化模型在未见目标域数据集DT = {(xTi, yTi) | i = 1, 2, …, nT}上的预测标签?Ti与真实标签yTi之间的误差。
DRIVE数据集。3 包含40张视网膜图像。每张图像分辨率为584 × 565像素,是3通道彩色图像。该数据集包括20张训练图像和20张测试图像。在本文中,我们将20张训练图像划分为15张训练图像和5张测试图像,分别命名为DRIVE_train和DRIVE_test。
CHASE_DB1数据集。4 包含28张彩色眼底图像,分辨率为999 × 960像素。
本文提出了一种新颖的单域泛化框架FVFDSDG。通过结合频率多视角特征解耦、结构频率视角插值(SFVI)策略和注意力机制,FVFDSDG能有效提取医学图像的多样化特征,增强模型的泛化能力,尤其在复杂的医学图像分割任务中展现出显著优势。
尽管FVFDSDG在医学图像分割任务中取得了显著成就,但仍有许多潜在的改进方向。未来的研究可以进一步探索该框架在其他医学图像任务中的应用,例如肿瘤检测、器官分割等。此外,在处理更多样化和具有挑战性的医学图像时,如何进一步提升其泛化能力和准确性,仍然是一个值得深入探索的问题。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号