
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于解释性方法的对比学习优化在序列推荐系统中的研究与应用
【字体: 大 中 小 】 时间:2025年06月11日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对序列推荐中对比学习(CL)因随机噪声导致正样本语义失真问题,研究者提出CLEM4Rec模型,通过解释性方法计算序列重要性并引入自适应频率滤波模块降噪,显著提升正样本质量。实验表明该方法在五个真实数据集上超越现有技术,为推荐系统性能优化提供新思路。
在数字化浪潮中,推荐系统已成为电商、流媒体等平台的核心技术,而序列推荐(Sequential Recommendation, SR)通过挖掘用户历史行为的时间模式,能够更精准地预测用户兴趣。然而,现有方法面临两大挑战:数据稀疏性导致模型训练不足,以及用户交互中的随机噪声(如误点击)干扰语义建模。尽管对比学习(Contrastive Learning, CL)通过拉近正样本对、推开负样本对的方式提升了表征质量,但传统CL4SRec等模型采用随机数据增强(如掩码、裁剪),可能破坏正样本的语义一致性;而DuoRec的监督采样策略因噪声干扰,可能将不同语义序列误判为相似样本,形成“假阳性”问题,最终导致推荐性能下降。
针对这一瓶颈,中国研究人员提出CLEM4Rec模型,创新性地将解释性方法(Explanation Method)与频率域降噪技术结合,首次实现基于语义相似性的正样本筛选。该成果发表于《Expert Systems with Applications》,其核心突破在于:通过集成梯度(Integrated Gradients)量化序列中每个项目对预测结果的贡献度,构建重要性权重矩阵,从而准确计算序列间语义相似性;同时设计自适应频率滤波模块,将用户序列转换至频域后利用可学习滤波器抑制噪声,再逆变换回序列空间。这种“语义清洗+噪声过滤”的双重机制,显著提升了对比学习的样本质量。
关键技术方法
研究采用多任务学习框架,结合推荐主任务和对比学习辅助任务。首先利用Transformer架构建模用户序列,通过集成梯度(50次积分步长)计算项目重要性;其次设计频率滤波模块,对序列进行傅里叶变换后应用可学习滤波器实现自适应降噪;最后基于重要性权重矩阵筛选高语义相似性正样本,优化InfoNCE损失函数。实验在五个公开数据集(含电商和社交平台数据)上验证性能,采用Hit Rate@K和NDCG@K作为评估指标。
研究结果
结论与意义
该研究首次将解释性方法与频域降噪引入序列推荐的对比学习框架,解决了假阳性样本导致的语义漂移问题。CLEM4Rec不仅为推荐系统提供更可靠的用户表征学习方案,其“重要性权重+频域滤波”的技术路径对医疗时序数据分析、金融行为预测等跨领域任务具有普适参考价值。未来研究可探索该方法在CNN、GNN等架构的迁移应用,进一步拓展其解释性与鲁棒性优势。
生物通微信公众号
知名企业招聘