基于解释性方法的对比学习优化在序列推荐系统中的研究与应用

【字体: 时间:2025年06月11日 来源:Expert Systems with Applications 7.5

编辑推荐:

  针对序列推荐中对比学习(CL)因随机噪声导致正样本语义失真问题,研究者提出CLEM4Rec模型,通过解释性方法计算序列重要性并引入自适应频率滤波模块降噪,显著提升正样本质量。实验表明该方法在五个真实数据集上超越现有技术,为推荐系统性能优化提供新思路。

  

在数字化浪潮中,推荐系统已成为电商、流媒体等平台的核心技术,而序列推荐(Sequential Recommendation, SR)通过挖掘用户历史行为的时间模式,能够更精准地预测用户兴趣。然而,现有方法面临两大挑战:数据稀疏性导致模型训练不足,以及用户交互中的随机噪声(如误点击)干扰语义建模。尽管对比学习(Contrastive Learning, CL)通过拉近正样本对、推开负样本对的方式提升了表征质量,但传统CL4SRec等模型采用随机数据增强(如掩码、裁剪),可能破坏正样本的语义一致性;而DuoRec的监督采样策略因噪声干扰,可能将不同语义序列误判为相似样本,形成“假阳性”问题,最终导致推荐性能下降。

针对这一瓶颈,中国研究人员提出CLEM4Rec模型,创新性地将解释性方法(Explanation Method)与频率域降噪技术结合,首次实现基于语义相似性的正样本筛选。该成果发表于《Expert Systems with Applications》,其核心突破在于:通过集成梯度(Integrated Gradients)量化序列中每个项目对预测结果的贡献度,构建重要性权重矩阵,从而准确计算序列间语义相似性;同时设计自适应频率滤波模块,将用户序列转换至频域后利用可学习滤波器抑制噪声,再逆变换回序列空间。这种“语义清洗+噪声过滤”的双重机制,显著提升了对比学习的样本质量。

关键技术方法
研究采用多任务学习框架,结合推荐主任务和对比学习辅助任务。首先利用Transformer架构建模用户序列,通过集成梯度(50次积分步长)计算项目重要性;其次设计频率滤波模块,对序列进行傅里叶变换后应用可学习滤波器实现自适应降噪;最后基于重要性权重矩阵筛选高语义相似性正样本,优化InfoNCE损失函数。实验在五个公开数据集(含电商和社交平台数据)上验证性能,采用Hit Rate@K和NDCG@K作为评估指标。

研究结果

  1. 模型性能对比:CLEM4Rec在五个数据集上的Hit Rate@10和NDCG@10平均提升9.3%和11.2%,显著优于CL4SRec、DuoRec等基线,证明语义对齐的有效性。
  2. 消融实验:频率滤波模块使噪声序列的语义一致性提升23%,解释性方法贡献了62%的正样本质量改进,验证双模块协同必要性。
  3. 噪声鲁棒性:在注入20%随机噪声的合成数据中,CLEM4Rec性能波动幅度仅为基线模型的1/4,凸显其抗干扰能力。

结论与意义
该研究首次将解释性方法与频域降噪引入序列推荐的对比学习框架,解决了假阳性样本导致的语义漂移问题。CLEM4Rec不仅为推荐系统提供更可靠的用户表征学习方案,其“重要性权重+频域滤波”的技术路径对医疗时序数据分析、金融行为预测等跨领域任务具有普适参考价值。未来研究可探索该方法在CNN、GNN等架构的迁移应用,进一步拓展其解释性与鲁棒性优势。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号