基于模糊聚类的双通道对比学习在多行为推荐中的应用研究

【字体: 时间:2025年06月22日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  针对多行为推荐中用户-项目交互数据稀疏、行为语义建模不充分等问题,研究人员提出Fuzzy Clustering-based Dual-Channel Contrastive Learning (FCCL)模型。该模型通过图卷积网络生成独立嵌入,结合模糊聚类与硬聚类分别建模用户兴趣扩散和项目提供者影响,实验证明其显著提升推荐效果,为复杂行为依赖关系建模提供新范式。

  

在数字化浪潮席卷全球的今天,推荐系统已成为电商、社交、娱乐等平台的核心技术。然而,当用户的一次购物行为可能包含浏览、加购、分享、购买等多个动作时,传统单行为推荐模型就显得力不从心。更棘手的是,这些行为数据往往呈现高度稀疏性——用户实际交互的项目占比可能不足1%,而不同行为间的复杂依赖关系又难以捕捉。现有方法要么过度简化行为关联,要么陷入模型复杂度的泥潭,甚至忽略了项目本身属性对行为的影响。例如,一位足球爱好者可能同时浏览运动鞋和营养品,但前者反映兴趣偏好,后者则可能受社交圈影响,这种差异在现有模型中常被混为一谈。

针对这些挑战,凯里学院的研究团队在《Engineering Applications of Artificial Intelligence》发表了一项创新研究。他们提出的FCCL模型首次将模糊聚类与硬聚类策略分别应用于用户和项目建模:用户兴趣因其多样性采用模糊聚类,而项目属性因其稳定性采用硬聚类。通过双通道对比学习框架,模型不仅能识别用户对运动鞋的"真实兴趣"与营养品的"社交驱动"行为差异,还能挖掘项目品牌、类别等固有属性对行为的影响。实验表明,该模型在Taobao等真实数据集上的推荐准确率较现有最优模型提升12.7%,尤其在稀疏场景下优势更为显著。

关键技术方法包括:1) 基于图卷积网络(GCN)的用户/项目独立嵌入生成;2) 用户级模糊聚类对比学习模块,通过融合损失函数捕捉用户-项目相似性;3) 项目级硬聚类模块,利用品牌、提供商等属性构建项目-实体关系;4) 双通道优化机制整合两类聚类结果。研究采用公开基准数据集验证,通过留一法评估点击率(CTR)和购买转化率等指标。

研究结果
Fuzzy clustering-based joint clustering
通过自适应模糊C均值算法处理用户多兴趣重叠问题,相比传统硬聚类使用户兴趣覆盖率提升23.4%。例如,同一用户对"智能手表"的浏览行为和"运动手环"的购买行为被识别为不同兴趣簇,但允许部分隶属度重叠。

Dual-channel linear propagation
双通道设计有效区分项目的双重角色:在用户-项目交互通道中,项目作为兴趣载体;在项目-实体通道中则体现品牌属性。这种解耦使模型能同时学习到用户对"苹果手机"的技术偏好(高配置需求)和品牌忠诚度(重复购买倾向)。

Adaptive contrastive learning
提出的贝叶斯个性化排序(BPR)对比损失函数,在MovieLens数据集上将长尾项目推荐成功率提高18.9%。通过负采样策略增强对非交互项目的表征能力,缓解数据稀疏问题。

结论与意义
该研究开创性地将差异聚类策略引入多行为推荐:用户侧模糊聚类捕捉兴趣多样性(如一位用户可同时80%属于"户外装备"簇和40%属于"健康食品"簇),项目侧硬聚类保持语义纯度(如"iPhone 15"严格归属于"智能手机"类)。这种"分而治之"的思路突破了传统联合聚类的信息混淆瓶颈。双通道架构不仅减少参数爆炸风险(较分离式建模节省37%参数),还通过项目角色解耦增强可解释性——例如识别出某次购买行为中,用户决策30%受产品功能驱动,70%受社交圈影响。

未来研究可向三个方向拓展:一是引入时间动态性,捕捉用户兴趣漂移;二是整合跨平台行为数据;三是探索聚类数量自适应机制。该成果不仅为推荐系统提供新方法论,其"用户-项目差异建模"思想对社交网络分析、精准营销等领域亦有启示意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号