基于多智能体强化学习的共识构建方法在大规模群体决策中的应用

《Information Fusion》:Multi-Agent Reinforcement Learning-based consensus building for Large-Scale Group Decision Making

【字体: 时间:2025年08月22日 来源:Information Fusion 15.5

编辑推荐:

  多类型上下文感知对话推荐系统MCCRS通过混合专家机制融合结构化知识图谱与非结构化对话历史、物品评论,椅人协调各专家生成推荐结果,实验表明其性能显著优于现有基线。

  
Jie Zou|Cheng Lin|Weikang Guo|Zheng Wang|Jiwei Wei|Yang Yang|Heng Tao Shen

摘要

对话推荐系统能够实现自然语言交流,从而带来更加引人入胜且高效的推荐体验。由于推荐系统的对话通常包含有限的上下文信息,许多现有的对话推荐系统会结合外部资源来丰富这些信息。然而,如何整合不同类型的上下文信息仍然是一个挑战。在本文中,我们提出了一种多类型上下文感知的对话推荐系统(MCCRS),通过专家组合(mixTURE-of-experts)技术有效融合多种类型的上下文信息,以提升对话推荐系统的性能。MCCRS结合了结构化信息和非结构化信息,包括结构化的知识图谱、非结构化的对话历史以及非结构化的商品评论。该系统由多个专家组成,每个专家专注于特定的领域(即一种特定的上下文信息),并通过一个ChairBot来协调这些专家以生成最终结果。实验证明,与现有的基线方法相比,我们提出的MCCRS模型具有显著更高的性能。

引言

近年来,对话推荐系统已成为一个重要的研究课题[1]、[2]。与传统主要依赖历史数据和用户行为的推荐系统不同,对话推荐系统利用自然语言交流的能力,提供个性化且上下文感知的推荐服务。通过对话互动,用户能够获得更加吸引人且有效的推荐结果。
随着对话推荐系统受到越来越多的研究关注,已经出现了许多新的方法来推动该领域的发展[3]、[4]、[5]、[6]、[7]、[8]、[9]、[10]、[11]、[12]、[13]。由于推荐系统的对话通常较短且上下文信息有限,因此在许多研究中引入外部资源来丰富上下文信息已成为常见做法[4]、[14]。在这些外部资源中,最常用的有知识图谱[3]、[15]和商品评论[14]。然而,如何整合不同类型的上下文信息仍然是一个难题。
其中一个挑战是不同外部数据的异构性。例如,知识图谱是结构化数据,而对话和商品评论是非结构化数据。多类型数据和异构数据之间存在语义差异,这使得它们难以对齐。一种可能的解决方案是对比学习[14]、[16],但对比学习需要所有外部数据中都包含相同的条目才能计算对比损失,而这并不总是可行的。
在这项工作中,我们提出了一种名为MCCRS的多类型上下文感知对话推荐系统,通过专家组合技术有效融合多种类型的上下文信息。MCCRS结合了结构化信息和非结构化信息,包括结构化的知识图谱、非结构化的对话历史以及非结构化的商品评论。我们的模型采用专家组合结构设计,包括一个ChairBot和多个专家,每个专家专注于一个特定的领域。ChairBot负责协调这些专家并生成最终结果。与以往的方法相比,MCCRS的优势至少有四点:首先,它解决了数据异构性和语义融合的问题,并突破了单一上下文信息的限制;其次,它利用了不同专家的专业知识,打破了这一限制;第三,由于每个专家专注于特定领域,当模型产生良好或不良结果时,可以更容易地追踪责任方;第四,MCCRS模型具有较好的扩展性,可以轻松添加更多专家以整合更多外部资源。
总结来说,本工作的主要贡献有三个方面:
  • 我们提出了一种新的对话推荐系统方法,称为MCCRS。
  • 我们提出了一种新的专家组合框架,由ChairBot和多个专家组成,以有效利用多种类型的上下文信息。
  • 广泛的实验表明,我们提出的MCCRS模型在性能上显著优于各种现有的最先进(SOTA)基线方法。
据我们所知,MCCRS是首个为对话推荐系统设计ChairBot和多个专家的模型。

相关工作

相关研究

对话推荐系统通过聊天机器人和智能助手等对话界面,利用类似人类的自然语言提供个性化且引人入胜的推荐服务[1]、[17]、[18]、[19]、[20]。近年来,随着对话系统的快速发展,这一领域受到了广泛关注。
一般来说,对话推荐系统可以分为两大类[7]、[12]、[21]、[22],其中包括基于锚点的对话推荐系统。

方法

在本节中,我们将介绍所提出的MCCRS模型。该模型包括一个ChairBot和三个专家:对话专家、图谱专家和评论专家。图1展示了我们模型的整体架构。接下来,我们将详细描述这三个专家,然后介绍我们的专家组合推荐机制以及如何利用这些专家来生成推荐结果。

实验

在我们的实验中,我们想要探讨以下研究问题:
    RQ1
    我们提出的模型与现有基线的表现如何?
    RQ2
    模型中不同组件的影响是什么?
    RQ3
    我们模型中的各种参数对其效果有何影响?

结论与未来工作

在本文中,我们提出了MCCRS模型用于对话推荐系统。该模型采用专家组合结构,利用多种类型的数据,包括结构化的知识图谱、非结构化的对话历史以及非结构化的商品评论。模型由三个专家组成,每个专家专注于一种特定的上下文数据类型。ChairBot根据各专家的重要性来协调这些专家,从而生成推荐结果。

作者贡献声明

Jie Zou:撰写 – 审稿与编辑、初稿撰写、可视化、验证、方法论设计、资金获取、数据分析、概念化。Cheng Lin:撰写 – 审稿与编辑、可视化、验证、数据分析、概念化。Weikang Guo:撰写 – 审稿与编辑、验证、项目管理、数据分析、概念化。Zheng Wang:撰写 – 审稿与编辑、验证、数据分析。

利益冲突声明

作者声明他们没有已知的财务利益冲突或个人关系可能会影响本文的研究结果。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号