
-
生物通官微
陪你抓住生命科技
跳动的脉搏
ActiveFreq:融合主动学习与频域分析的交互式医学图像分割新方法
【字体: 大 中 小 】 时间:2025年07月22日 来源:Knowledge-Based Systems 7.2
编辑推荐:
针对现有交互式分割方法对误标区域处理效率低且忽视频域特征的问题,研究人员提出ActiveFreq框架,集成主动学习模块AcSelect和频域增强网络FreqFormer。该研究在ISIC-2017和OAI-ZIB数据集上实现NoC@90指标提升23.5%和12.8%,以极简用户交互(如2次点击)达到85.29% mIoU,为医学图像精准标注提供新范式。
在医学影像分析领域,精确的像素级标注如同为模糊的X光片描摹骨骼轮廓,其重要性不言而喻。然而现有交互式分割方法面临双重困境:一方面像盲人摸象般随机处理误标区域,用户往往需要反复点击才能修正错误;另一方面过度依赖空间域特征,忽视了频域中隐藏的"图像密码"——那些能区分血管纹理与设备噪声的高频信号。更令人遗憾的是,当算法面对OAI-ZIB数据集复杂的软骨结构时,传统方法需要近11次点击才能达到90%的标注精度,这种低效严重制约了临床工作效率。
针对这些痛点,来自国内研究团队(根据基金编号推测为湖北省科技厅重点研发计划支持单位)的科研人员开发了ActiveFreq框架,相关成果发表于《Knowledge-Based Systems》。该研究创新性地将主动学习机制与频域特征提取相结合:通过AcSelect模块的熵值三重评估(最大像素熵MPE、平均像素熵APE、区域群不确定性RGU),智能识别出最具修正价值的误标区域;同时设计的FreqFormer网络在SegFormer架构中嵌入二维离散傅里叶变换(2D DFT),实现空间-频域特征融合。研究采用ISIC-2017皮肤病变和OAI-ZIB骨关节数据集验证,通过对比CDNet等7种基线方法,结合消融实验验证模块有效性。
关键技术包括:1) 基于熵度量的主动学习区域选择策略;2) 跨高度-宽度/通道的多维傅里叶变换;3) 轻量级掩膜校正网络架构。所有实验均采用NoC@90(达到90%交并比所需点击次数)和mIoU(平均交并比)作为核心评估指标。
【主要发现】
AcSelect模块效能:在ISIC-2017数据集上,该模块使单次点击的mIoU增益提升37.2%,误标区域选择准确率达89.4%。其创新性在于同时考察像素级不确定性和区域一致性,避免传统方法"见木不见林"的缺陷。
FreqFormer性能突破:通过频域能量谱分析,网络对<5像素的微细血管识别率提升21.8%。特别在OAI-ZIB软骨分割中,频域特征使边界模糊区域的Hausdorff距离降低15.6%。
整体性能对比:ActiveFreq以3.74次点击(ISIC-2017)和9.27次点击(OAI-ZIB)达到NoC@90,较FocalClick分别减少23.5%和12.8%的交互成本。在极限测试中(2次点击),其mIoU仍保持75%以上,证明算法在最小用户干预下的鲁棒性。
【讨论与展望】
研究揭示了频域特征对医学图像细粒度分割的独特价值:傅里叶变换模块能有效抑制CT图像中的环状伪影(高频噪声),同时增强MRI中灰白质边界的低频信号。值得注意的是,AcSelect模块展现出跨架构适应性,当移植到HRNet-18 backbone时仍保持85%以上的区域选择准确率。
局限性在于当前2D DFT处理可能丢失切片间关联信息,未来或需引入三维频域分析。作者建议探索误标区域间的拓扑关系,这将有助于处理如脑肿瘤浸润区等复杂病理结构。该成果为降低医学图像标注门槛提供了新思路,其技术路线可扩展至内镜影像分析、病理切片标注等领域,对推动AI辅助诊断的临床落地具有显著意义。
生物通微信公众号
知名企业招聘