超越权衡:利用用户偏好的时空异质性来实现交互式推荐中的长期公平性和准确性
《ACM Transactions on the Web》:Beyond Trade-offs: Leveraging Spatiotemporal Heterogeneity of User Preference for Long-term Fairness and Accuracy in Interactive Recommendation
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on the Web
编辑推荐:
公平推荐与长尾曝光优化。针对传统推荐系统在静态环境下平衡公平性和准确性的局限,提出HER4IF框架,通过分层强化学习动态感知用户偏好的时空异质性,设计高层持续优化公平约束的低层推荐策略,在电商场景中实现公平性提升23.6%和准确率提高18.4%,突破传统权衡范式。
摘要
由于推荐系统在电子商务和网页内容共享等各种网络领域中至关重要,因此无论项目受欢迎程度如何,都应确保其得到公平的展示。然而,传统的公平性考虑方法通常旨在实现推荐准确性和公平性之间的最佳平衡,并专注于在静态环境下提高长尾项目的曝光率,通过日志数据来评估一次性推荐决策的公平性。这些方法忽视了现实世界交互环境中用户偏好的动态特性。相比之下,我们的工作寻求一种双赢的解决方案,能够在长期内同时提高推荐准确性和公平性,而不仅仅是两者之间的权衡。为了实现这一目标,我们实证分析了用户偏好偏好的时空异质性。我们的发现揭示了互补的特性,充分利用这些特性可以指导长期公平性的个性化策略。基于这一见解,我们提出了HER4IF,这是一个专为交互式推荐设计的新层次强化学习框架。HER4IF将推荐过程分解为两个关键任务:动态公平性控制和项目推荐。高层代理持续从不断变化的用户偏好中学习适应性公平性约束,而低层代理则在这些个性化约束下优化推荐策略。在三个真实世界数据集和交互式推荐平台KuaiSim上的广泛实验表明,HER4IF的性能显著优于现有方法,在公平性和推荐准确性方面都取得了显著提升。我们的代码可在以下链接获取:https://github.com/1163710212/HER4IF。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号