
-
生物通官微
陪你抓住生命科技
跳动的脉搏
四元数驱动的色彩医学图像分割:解耦色彩与纹理特征分布差异的创新框架
【字体: 大 中 小 】 时间:2025年06月11日 来源:Expert Systems with Applications 7.5
编辑推荐:
为解决传统深度学习方法在色彩医学图像分割中忽视色彩与纹理信息分布差异的问题,研究人员提出基于四元数(Quaternion)的QsegNet框架,通过解耦色彩空间与灰度空间的特征学习,结合跨类别语义调节器(ICSR)和动态特征整合策略(DFIS),显著提升分割性能。实验证明该方法在多个公开数据集和自建BMCS数据集上实现最优性能与计算效率平衡,为计算机辅助诊断提供新思路。
在计算机辅助诊断领域,色彩医学图像分割技术正面临一个关键瓶颈:现有深度学习方法往往将色彩与纹理特征混为一谈,却忽略了它们在空间分布上的本质差异。色彩信息在不同通道间呈现动态变化和光谱互补性,而纹理特征则保持跨通道一致性。这种"一锅炖"式的特征提取方式,导致模型对色彩语义的理解出现偏差,直接影响病灶定位的准确性。
这一难题的根源在于传统卷积神经网络(CNN)和Transformer架构的固有局限。无论是早期的U-Net、SegNet,还是后来的SwinU-Net、Missformer等模型,都未能有效区分色彩与纹理的特征表达。更令人担忧的是,随着Mamba结构、图卷积和多层感知机(MLP)等新型架构的涌现,色彩信息的精确建模反而被进一步边缘化。
正是在这样的背景下,华中科技大学的研究团队独辟蹊径,从数学领域"借"来四元数这一利器。四元数由1个实部和3个虚部构成,其独特的旋转和振幅特性恰好能捕捉色彩通道间的耦合关系。基于此,他们创新性地提出QsegNet框架,首次将四元数引入色彩医学图像分割领域。
研究团队采用三大核心技术:首先建立四元数色彩空间与传统灰度空间的双通道特征提取体系;其次设计跨类别语义调节器(ICSR),通过多阶段交互生成约束权重,逐步弥合两类特征的语义鸿沟;最后开发动态特征整合策略(DFIS),自适应筛选最具语义价值的特征图进行融合。这些创新使模型在保持轻量化的同时(得益于四元数卷积的可分离计算特性),实现了对色彩信息的精确建模。
方法设计亮点
研究在自建的2023 BMCS(骨髓细胞分割)数据集和多个公开数据集上验证性能。四元数卷积层处理RGB图像时,将三个色彩通道分别映射到虚部,通过哈密顿乘积捕捉通道间关联。ICSR模块采用层级注意力机制,在四个不同尺度空间对齐色彩与纹理特征。DFIS则通过描述符聚类分析,动态分配两类特征的融合权重。
实验结果分析
在皮肤镜图像和肠息肉数据集上的测试表明,QsegNet的Dice系数平均提升2.3%,而参数量仅为SwinU-Net的68%。消融实验证实ICSR能使特征对齐误差降低41%,DFIS则贡献了15.7%的分割精度提升。特别在BMCS数据集上,模型对骨髓细胞边界的识别准确率达到92.4%,显著优于现有方法。
讨论与展望
该研究首次从理论层面阐明色彩与纹理信息的分布差异,为医学图像处理提供了新的特征解耦范式。四元数的引入不仅解决了色彩通道的耦合表征问题,其旋转特性还为三维医学图像分析埋下伏笔。局限性在于当前框架对高光谱图像的支持不足,未来可探索超复数扩展。
这项发表于《Expert Systems with Applications》的成果,标志着色彩医学图像分割从"粗放式特征提取"迈向"精细化语义理解"的关键一步。其提出的双空间学习框架,不仅适用于细胞分割,更为皮肤病损检测、内窥镜影像分析等场景提供了普适性解决方案。团队开源代码和BMCS数据集的决定,将进一步推动该领域的技术民主化进程。
生物通微信公众号
知名企业招聘