
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于类别与多层次用户意图建模的会话推荐系统研究
【字体: 大 中 小 】 时间:2025年06月12日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
针对会话推荐中细粒度用户意图挖掘不足和物品类别信息利用不充分的问题,研究人员提出CIS模型,通过构建多层次意图图与类别图、迭代表示学习及集成预测策略,在Diginetica和Tmall数据集上实现HR@20提升24.38%、MRR@20提升69.56%,为复杂用户意图建模提供新范式。
在信息爆炸的数字时代,推荐系统已成为缓解信息过载的核心工具。然而,当用户因隐私保护而隐匿长期行为数据时,传统推荐系统面临严峻挑战。会话推荐系统(Session-based Recommendation, SBR)通过匿名行为序列预测用户兴趣,成为解决这一难题的关键技术,广泛应用于视频平台、电商和社交媒体。尽管现有研究在序列建模上取得进展,但两大瓶颈问题始终未解:一是传统方法仅孤立分析单个物品,忽视连续物品组合揭示的细粒度用户意图(Fine-grained User Intentions);二是过度依赖物品ID而忽略类别信息(Category Semantics)的语义价值,导致难以捕捉用户潜在需求。
针对上述问题,中国国家自然科学基金支持的研究团队提出CIS模型(Category and multi-level user Intentions for Session-based recommendation),发表于《Engineering Applications of Artificial Intelligence》。该研究创新性地将多层次意图建模与类别语义融合,通过三项核心技术实现突破:1)采用层间分割(Inter-level Division)和层内合并(Intra-level Mergence)构建多层次用户意图图和物品类别图;2)利用图卷积网络(Graph Convolutional Network, GCN)迭代更新意图与类别表示;3)设计集成预测策略(Integration Predicting)融合多层级意图信息。实验采用Diginetica和Tmall真实数据集验证,通过HR@20、MRR@20和NDCG@20等指标对比12种基线模型。
多级图构建模块
研究团队发现用户意图具有层次性特征。以包含"西红柿、面包、鸡蛋"的会话为例:L1层级(末项"鸡蛋")暗示"煎蛋"意图,推荐油;L2层级("面包+鸡蛋")指向"早餐"场景,推荐牛奶;L3层级(全序列)揭示"制作三明治"需求,推荐平底锅。CIS通过划分会话序列为不同粒度层级,分别构建意图图和类别图,其中意图节点由连续物品嵌入聚合生成,类别节点则整合对应物品的类别信息。
迭代表示学习模块
通过双向信息传递机制实现意图与类别的协同优化:GCN在意图图中聚合相邻节点特征,同时类别图通过注意力机制筛选相关类别语义。迭代更新过程中,类别信息辅助识别潜在意图(如"珠宝+服装"组合隐含"正式场合"意图),而意图特征反向优化类别表示,形成语义闭环。该模块通过3轮迭代达到最优表示效果。
会话嵌入与预测模块
生成各层级的会话嵌入后,采用门控机制自适应融合多级意图特征。集成预测策略对候选物品计算层级注意力权重,最终在Diginetica数据集上实现HR@20达54.72%,较最优基线SR-GNN提升24.38%;Tmall数据集MRR@20提升69.56%,验证多粒度意图建模的有效性。消融实验显示,去除类别信息会使NDCG@20下降19.3%,证实类别语义的关键作用。
结论与意义
CIS模型的创新性体现在三方面:1)首次提出多层次意图框架,通过L1-L3层级建模实现从具体行为到抽象需求的跨越;2)开创性地将物品类别作为意图识别媒介,利用更稠密的用户-类别交互提升推荐精度;3)迭代学习机制实现意图与类别的动态协同优化。该研究不仅为会话推荐提供新范式,其"细粒度意图挖掘-语义信息融合-动态表示优化"的技术路线,对医疗健康领域的病程预测、消费行为分析等时序建模任务具有重要借鉴价值。研究团队指出,未来可探索跨会话意图演化规律,并结合知识图谱增强可解释性。
生物通微信公众号
知名企业招聘