多模态技术助力重新学习:减轻序列推荐中的负面迁移效应

《Knowledge-Based Systems》:Multi-modality Meets Re-learning: Mitigating Negative Transfer in Sequential Recommendation

【字体: 时间:2025年09月19日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  针对预训练推荐模型中存在的负迁移问题,本文提出ANT方法,通过整合商品文本、图像和价格等多模态信息进行知识迁移,并采用重学习策略自适应目标任务,实验表明ANT在多个任务中显著优于基线方法,最高提升15.2%。

  在推荐系统的研究中,一个长期存在的挑战是如何从稀疏的用户交互数据中学习到有效的推荐模型。特别是在顺序推荐领域,由于可用物品数量的爆炸性增长,传统的推荐方法往往面临数据稀疏性的困扰。为了解决这一问题,近期的研究尝试通过预训练的方法,利用其他相关任务的丰富数据来学习可迁移的知识,并将其应用到目标任务中以提升推荐效果。然而,尽管这些预训练方法在理论上具有吸引力,但在实际应用中,它们常常会遭遇一个被称为“负迁移”(negative transfer)的问题,即从预训练模型迁移后得到的模型性能反而不如从头开始训练的模型。

为了解决这一问题,本文提出了一种名为ANT(Addressing Negative Transfer)的新方法,用于改进可迁移的顺序推荐模型。ANT的核心思想是通过引入多模态的物品信息,包括文本、图像和价格,来更有效地学习来自辅助任务的可迁移知识,同时采用一种重新学习的迁移策略,更好地捕捉目标任务中的特定信息。具体来说,ANT通过结合文本、图像和价格信息,提升了物品表示的丰富性,使得模型在辅助任务中能够学习到更具通用性的知识。此外,在目标任务的适应过程中,ANT不再依赖简单的微调策略,而是通过重新学习特定任务的参数,使模型更加专注于目标任务的特征,从而避免了负迁移的影响。

在实验部分,我们对ANT与多种现有的推荐方法进行了比较,包括基于用户交互的NPE、SASRec和BERTRec,以及基于多模态信息的FDSA、S3-Rec、UniSRec、VQRec、MissRec和RUNSRec。实验结果表明,ANT在五个不同的目标任务中均表现优异,其推荐性能在多个指标上显著优于基线方法,其中在Arts任务中,ANT的NDCG@10指标比基线方法提升了15.2%。这些结果表明,ANT不仅成功避免了负迁移问题,还在推荐效果上取得了显著提升。

ANT的设计考虑到了多模态信息的迁移能力。通过分析,我们发现物品文本在不同任务之间的差异可能较大,例如,服装描述通常强调外观,而电子产品描述则更关注功能,这使得基于文本的迁移效果受限。相比之下,物品图像和价格在不同任务之间表现出更强的迁移性。图像和价格能够提供更一致的信息,从而有助于模型在目标任务中更好地适应。此外,ANT还采用了一种基于混合专家(MoE)的嵌入转换策略,通过参数化和线性投影来增强嵌入表示的推荐相关性。这一策略不仅提高了模型的适应能力,还增强了其在不同任务之间的泛化能力。

在模型适应过程中,ANT采用了重新学习的策略,而不是传统的微调方法。这意味着,在目标任务中,ANT重新学习物品表示相关的参数,而不是直接使用预训练模型中的参数。这种方法可以更好地捕捉目标任务中的特定模式,从而避免因任务间差异过大而引起的负迁移。同时,ANT保留了预训练模型中的位置嵌入参数,以利用其在辅助任务中学习到的通用信息。此外,ANT在适应过程中固定了BERT和SWIN等预训练模型的参数,以提高计算效率。

ANT还引入了一种基于物品交互的嵌入表示,即交互基于的物品嵌入。这种方法能够增强模型对新物品的推荐能力,特别是在零样本推荐(zero-shot recommendation)的情况下。相比之下,传统的基于文本的推荐方法在面对新物品时往往表现不佳,因为它们无法从用户交互中获得足够的信息。ANT通过结合文本、图像和价格信息,不仅提高了推荐效果,还增强了模型在实际应用中的鲁棒性。

在实验分析中,我们还探讨了ANT与其他方法在负迁移问题上的表现。结果表明,传统的微调方法在多个任务中表现出明显的负迁移现象,即迁移后的模型性能不如从头训练的模型。相比之下,ANT通过引入多模态信息和重新学习策略,显著降低了负迁移的影响。在所有任务中,ANT的迁移模型都优于从头训练的模型,这表明ANT在适应过程中能够更有效地捕捉目标任务的特定信息,同时保留辅助任务中的通用知识。

此外,我们还进行了消融实验,以评估不同模块对ANT性能的贡献。结果表明,文本、图像和价格信息的结合对推荐效果有显著的提升作用,而基于MoE的嵌入转换和模态融合策略也对性能有重要影响。通过这些实验,我们验证了ANT设计的有效性,并进一步优化了其在不同任务中的表现。

在计算效率方面,ANT虽然引入了更多的参数,但通过MoE机制和参数固定策略,其训练时间和GPU内存消耗与现有方法相比保持在一个可接受的范围内。这意味着,ANT在保持高性能的同时,也具备良好的计算效率,能够适应不同的应用场景。

ANT的成功不仅在于其对负迁移问题的有效应对,还在于其对多模态信息的合理利用。通过将文本、图像和价格信息结合起来,ANT能够更全面地捕捉物品的特征,从而提升推荐的准确性和多样性。同时,ANT的重新学习策略使其能够更好地适应目标任务,避免了因任务差异而导致的性能下降。

未来的研究方向包括进一步扩展ANT的框架,以支持更多的模态信息,例如音频和视频。随着数据集的丰富和多样化,这些额外的信息可能会为推荐系统带来更多的提升空间。此外,我们还计划探索ANT在不同推荐场景下的适用性,例如在社交推荐和内容推荐中,以验证其泛化能力。

总的来说,ANT通过引入多模态信息和重新学习策略,有效解决了顺序推荐中的负迁移问题,提升了推荐模型的性能。这一方法为未来的研究提供了新的思路,也为实际推荐系统的优化提供了可行的方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号