"修剪-增强双模块框架：提升内窥镜图像深度与位姿估计的鲁棒性研究"

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年09月05日 来源：Medical Image Analysis 11.8

编辑推荐：

　　这篇研究提出创新的"修剪-增强"框架（Trimming-then-Augmentation），通过"掩膜-修复"策略（mask-then-recover）消除内窥镜图像伪影干扰，结合自适应特征增强模块，显著提升无监督学习（unsupervised learning）在6DoF位姿估计和深度重建中的精度。该方法突破传统SfM（Structure-from-Motion）在组织形变和特征稀缺场景的应用瓶颈，为腔内介入机器人（endoluminal intervention robot）提供更可靠的导航支持。

Highlight亮点聚焦

图像伪影与组织运动：内窥镜视频常见的镜面反射（specular highlights）和运动模糊会导致深度预测错误（图1a）。现有方法如条件对抗网络（conditional adversarial network）需人工标注伪影，而外观流网络（appearance-flow networks）仅能处理光照变化，局限性明显。

特征稀缺性挑战：与传统自然图像不同，内窥镜场景缺乏独特解剖标志物（anatomical landmarks），导致SIFT等特征点提取算子（Lowe, 2004）失效。尽管深度学习通过卷积神经网络（CNN）提取底层特征，该问题仍制约模型性能。

修剪模块创新：通过智能掩膜策略屏蔽伪影区域，利用上下文特征重建被遮蔽区域的深度信息（图1c）。该模块基于像素特性与不确定性分析，显著提升模型对管腔结构的全局感知能力。

增强模块突破：设计轻量级神经网络生成具有鉴别性的增强特征，通过任务特异性损失函数（task-specific loss）引导稳定特征配对。如图1c所示，增强后的图像可提取更多关键点，为后续三维重建提供可靠对应关系。

Conclusion研究价值

本框架通过"先修剪后增强"的协同机制，成功解决内窥镜图像特有的伪影干扰和特征贫乏难题。实验表明，该模块可无缝集成至现有6种三维重建方法，在活体（in vivo）环境中展现出卓越的鲁棒性和稳定性，为智能腔内手术导航系统奠定关键技术基础。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号