面向大语言模型推荐系统的难度感知分桶微调策略:一种简单高效的方法

【字体: 时间:2025年10月21日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  本文提出了一种创新的难度感知分桶微调策略(DBF),通过模拟人类从易到难的学习过程,显著提升基于大语言模型(LLM)的推荐系统(LLM-RM)性能。该策略基于类别熵、一致性和相似性构建推荐难度评分,采用桶内桶间双难度感知机制,并结合粗到细粒度提示模型CP4Rec实现两阶段推理。实验证明该方法在四个真实数据集上超越现有最优模型,为数据中心的LLM微调提供了新视角。

  
Highlight
近年来,大语言模型(LLM)因其卓越的多功能性和跨自然语言处理领域的有效性而获得广泛关注。在推荐系统(RS)领域,利用LLM提升推荐性能的研究兴趣激增。当前基于LLM的推荐系统研究主要可分为两类流行方法:
LLM作为增强器:此类方法将LLM视为特征提取器或文本增强工具,通过生成丰富的项目描述或用户画像来辅助传统推荐模型。
相关研究
任务构建
推荐系统通过分析用户历史交互行为(如评分、点击、购买等)推断用户偏好,并据此推荐可能感兴趣的项目。令用户集合为U,项目集合为I。对于给定用户u ∈ U,其按时间顺序排列的历史交互序列表示为Su = (iu1, iu2, ?, iuL),其中L为交互总数。每个项目i ∈ I通常包含类别等属性信息。
提出的方法
如第1节所述,现有LLM-RM将所有微调样本(即用于微调的推荐任务)同等对待,常采用简单的随机采样策略进行微调。然而,这些模型忽略了微调样本特性(如推荐难度差异)的影响,可能导致LLM泛化能力不足,从而降低推荐性能。为弥补这一空白,我们提出了一种简单而有效的...
数据集
为评估所提CP4Rec的有效性,我们在四个真实世界基准数据集上进行了实验:
  • MovieLens-1M:广泛使用的电影推荐数据集,包含约100万用户评分。
  • Steam:从Steam平台收集的大规模用户-游戏交互数据集,常用于游戏推荐。
  • Yelp:知名的商业推荐数据集,提供企业、用户及其交互的详细信息。
结论
我们提出了一种新颖的数据中心微调策略——难度感知分桶微调(DBF)策略。具体而言,我们首先提出了推荐难度评分来评估样本的难度水平,随后设计了包含桶内和桶间难度感知的分桶调优策略进行微调。通过引入DBF策略,我们考虑了不同样本的难度水平,系统性地增加了...
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号