
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于双阶段Transformer与扩散模型的OCTA图像运动伪影协同去除方法
【字体: 大 中 小 】 时间:2025年08月31日 来源:Pattern Recognition 7.6
编辑推荐:
本文提出TSAR框架,创新性地结合分层Transformer(Hformer)与残差条件扩散模型(RCDM),首次实现OCTA(光学相干断层扫描血管成像)中位移伪影、重复扫描伪影和白线伪影的协同去除。通过多尺度特征捕捉与上下文感知生成技术,显著提升视网膜血管成像质量,为糖尿病视网膜病变等疾病的精准诊断提供新工具。
Highlight
我们开发了双阶段运动伪影去除框架TSAR,其核心创新包括:
• 首创分层Transformer(Hformer),通过通道-轴向-轴内三级注意力机制(C-MSA/A-MSA/IA-MSA)精准矫正位移与重复扫描伪影的定向错位问题
• 设计残差条件扩散模型(RCDM),利用白线区域外上下文信息进行自适应修复,在消除伪影同时保留微血管结构细节
• 实验证实TSAR在合成和真实OCTA图像中均显著优于现有方法,为临床提供高保真血管影像
Method
TSAR采用级联处理策略:
第一阶段:Hformer的U型架构包含4级编解码器(4-6-6-8个Transformer块),通过[1,2,4,8]多头注意力配置实现跨尺度特征融合,专门针对伪影特有的垂直方向不连续性。
第二阶段:RCDM以带噪图像和掩膜为条件,采用渐进式扩散策略修复白线区域,其残差连接设计有效避免过度平滑。
Implementation Details
• Hformer预训练采用AdamW优化器(lr=2e-4),在RTX 3090 GPU上batch size=8
• RCDM设置扩散步长T=1000,应用余弦调度器控制噪声注入速率
• 数据增强包含随机旋转/翻转,模拟临床常见眼球运动场景
Conclusion
TSAR通过Transformer与扩散模型的协同创新,突破现有方法仅处理单一伪影的局限。其分层注意力机制和条件生成策略为医学图像修复领域提供新范式,特别适用于视网膜血管病变的早期筛查。代码已开源(GitHub),助力临床研究应用。
生物通微信公众号
知名企业招聘