基于双阶段Transformer与扩散模型的OCTA图像运动伪影协同去除方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月31日 来源：Pattern Recognition 7.6

编辑推荐：

　　本文提出TSAR框架，创新性地结合分层Transformer（Hformer）与残差条件扩散模型（RCDM），首次实现OCTA（光学相干断层扫描血管成像）中位移伪影、重复扫描伪影和白线伪影的协同去除。通过多尺度特征捕捉与上下文感知生成技术，显著提升视网膜血管成像质量，为糖尿病视网膜病变等疾病的精准诊断提供新工具。

Highlight

我们开发了双阶段运动伪影去除框架TSAR，其核心创新包括：

• 首创分层Transformer（Hformer），通过通道-轴向-轴内三级注意力机制（C-MSA/A-MSA/IA-MSA）精准矫正位移与重复扫描伪影的定向错位问题

• 设计残差条件扩散模型（RCDM），利用白线区域外上下文信息进行自适应修复，在消除伪影同时保留微血管结构细节

• 实验证实TSAR在合成和真实OCTA图像中均显著优于现有方法，为临床提供高保真血管影像

Method

TSAR采用级联处理策略：

第一阶段：Hformer的U型架构包含4级编解码器（4-6-6-8个Transformer块），通过[1,2,4,8]多头注意力配置实现跨尺度特征融合，专门针对伪影特有的垂直方向不连续性。

第二阶段：RCDM以带噪图像和掩膜为条件，采用渐进式扩散策略修复白线区域，其残差连接设计有效避免过度平滑。

Implementation Details

• Hformer预训练采用AdamW优化器（lr=2e-4），在RTX 3090 GPU上batch size=8

• RCDM设置扩散步长T=1000，应用余弦调度器控制噪声注入速率

• 数据增强包含随机旋转/翻转，模拟临床常见眼球运动场景

Conclusion

TSAR通过Transformer与扩散模型的协同创新，突破现有方法仅处理单一伪影的局限。其分层注意力机制和条件生成策略为医学图像修复领域提供新范式，特别适用于视网膜血管病变的早期筛查。代码已开源（GitHub），助力临床研究应用。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号