神经符号融合驱动的模糊逻辑原型网络:零样本学习新范式

【字体: 时间:2025年06月27日 来源:Pattern Recognition 7.5

编辑推荐:

  本研究针对零样本学习(ZSL)中语义与视觉特征对齐的挑战,提出融合神经符号人工智能(NeSy AI)的模糊逻辑原型网络(FLPN)。通过逻辑张量网络(LTN)框架将类层次、属性约束等先验知识转化为可微损失函数,在AWA2、CUB等基准测试中,FLPN以CNN/ViT双骨干实现SOTA性能(如AWA2的H=76.61),为小样本场景下的知识驱动学习提供新思路。

  

在人工智能领域,如何让机器识别从未见过的物体类别一直是极具挑战性的任务。零样本学习(ZSL)通过利用语义属性等辅助信息实现这一目标,但传统方法面临视觉-语义空间对齐不充分、属性利用效率低等瓶颈。尤其当测试集同时包含已知和未知类别时(即广义零样本学习GZSL),模型容易对已知类产生严重偏倚。

针对这些问题,国内某研究机构团队在《Pattern Recognition》发表研究,提出名为模糊逻辑原型网络(FLPN)的创新架构。该工作将神经符号人工智能(NeSy)与原型网络相结合,首次实现了多粒度知识(类层次、属性关系、例外处理)的系统性嵌入,在AWA2数据集上取得H=76.61的突破性性能,较前最优提升2.5个百分点。

关键技术包括:1)基于逻辑张量网络(LTN)的符号知识编码,将一阶逻辑公理转化为可微约束;2)多级原型空间构建,同步学习类、宏类及属性级嵌入;3)面向CNN/ViT双骨干的注意力机制,实现属性定位与特征解耦;4)基于余弦相似度的自适应掩码策略,缓解不可见属性的干扰。实验使用标准ZSL基准数据集(AWA2/CUB/SUN),通过消融研究验证各模块贡献。

【层级原型构建】
通过ΠθCθMθA三级投影函数,将类别、宏类(如"猫科动物")和85维属性向量映射到共享嵌入空间。其中宏类原型利用WordNet语义层次,使"斑马"等未见类能通过"有蹄类"宏类关联已知特征。

【知识驱动的损失设计】
核心创新在于将6类符号约束转化为损失项:1)类别公理?class强制样本靠近本类原型;2)宏类公理?macro保持层次一致性;3)掩码公理?masked随机屏蔽15个低频属性以增强鲁棒性;4)属性公理?attr通过注意力机制定位视觉特征;5)相似性公理?simil约束同类样本聚集;6)相异性公理?dissimil推远异类样本。实验表明引入全部公理可使CUB数据集H值提升10.1%。

【双骨干适配】
在ResNet-101和ViT架构上分别设计特征提取方案:CNN分支采用四层卷积提取区域特征,ViT分支通过[CLS]令牌实现全局表征。特别地,属性权重矩阵Wa∈RA作为门控机制,动态调节各属性对分类的贡献度,在SUN数据集上使未见类准确率提升5.9%。

研究结论表明,FLPN通过符号逻辑与神经网络的深度融合,实现了三大突破:1)首次在ZSL中系统整合类层次与属性约束知识;2)通过LTN框架将离散逻辑运算转化为连续优化问题;3)在CNN和ViT架构上均保持高效性(0.55s/图)。相比生成式方法如Cycle-CLSWGAN,FLPN无需合成样本即可在FLO数据集达到H=70.70,验证了神经符号方法在资源受限场景的优势。

讨论部分指出,该方法仍存在对属性标注质量的依赖性,未来可探索自监督知识获取。但当前工作已为多模态知识融合提供了可扩展框架,特别在医疗影像等标注稀缺领域展现应用潜力。其核心价值在于证明:通过形式化逻辑注入领域知识,能显著提升深度学习模型的泛化能力与可解释性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号