SEAGET 模型:精准预测下一个兴趣点,解锁个性化出行新体验

【字体: 时间:2025年04月22日 来源:Array 2.7

编辑推荐:

  在旅游等行业,精准预测用户未来的行动轨迹是提供个性化服务的关键挑战。研究人员开展 “Seasonal and active hours guided graph enhanced transformer for the next POI recommendation” 研究,提出 SEAGET 模型。结果显示该模型能更准确预测下一个兴趣点 (POI),对优化旅游体验等意义重大。

  随着互联网的发展,位置基于社交网络(LBSNs)产生了大量用户签到数据,这为探索用户签到行为趋势提供了机会。兴趣点(POI,Point of Interest)推荐系统应运而生,旨在根据用户过去和现在的足迹预测他们接下来可能访问的 POI,从而帮助用户更好地探索周边环境,也助力企业优化广告策略。然而,当前的 POI 推荐系统存在诸多问题。一方面,多数系统仅依据签到数量定义 POI 的流行度,忽略了用户数量、签到时间的近期性等因素,导致推荐结果不够理想。例如,两个 POI 的签到数量相近,但一个近期签到多,一个是多年前签到多,仅按签到数量判断流行度就无法准确反映当前的实际情况。另一方面,季节动态和 POI 的运营时间对用户选择 POI 的影响常被忽视。在炎热的夏季,人们通常不会选择去繁忙的海滩;而在秋季,由于树叶凋零,森林的吸引力下降,游客也会减少。此外,如果推荐系统在用户询问午餐地点时,推荐一家只提供晚餐的餐厅,或者推荐当天关闭的公园,这无疑会降低用户体验。
为了解决这些问题,研究人员开展了关于 “Seasonal and active hours guided graph enhanced transformer for the next POI recommendation” 的研究,提出了季节和活跃时间引导的图增强变压器(SEAGET,Seasonal and Active hours - guided Graph - Enhanced Transformer)模型。该研究具有重要意义,它能更准确地预测用户下一个可能访问的 POI,从而优化旅游体验,提升基于位置的服务质量,对旅游和相关行业的发展有着积极的推动作用,相关成果发表在《Array》。

研究人员在该研究中主要运用了以下关键技术方法:首先,对收集到的 FourSquare - NYC 公共数据集进行预处理,通过筛选排除 POI 和用户签到数少于 10 次的数据,消除单签的异常值,并随机将 80% 的轨迹数据用于训练,10% 用于验证,10% 用于测试,确保数据的质量和代表性。其次,利用图卷积网络(GCN,Graph Convolutional Network)学习 POI 的嵌入表示,捕捉其转换模式和属性;通过定义转移注意力图来明确 POI 之间的转移概率,调整最终预测结果。此外,构建上下文嵌入模块,融合 POI - 用户、时间 - 类别、季节 - POI 的嵌入信息,为推荐提供更全面的上下文理解。最后,使用 Transformer 编码器和多层感知器(MLP,Multi - Layer Perceptron)解码器进行预测,并通过操作时间过滤器排除当前不可用的 POI,提高推荐的准确性。

研究结果


  1. 流行度定义:研究人员重新定义了 POI 的流行度,公式为 Popularity = β(α?Cuserrec + (1 - α)?Cchkinrec) + (1 - β)(α?Cuserpast + (1 - α)?Cchkinpast)。其中,Cchkinrec表示近期签到的唯一用户总数,Cuserrec表示近期用户签到数,CuserpastCchkinpast分别表示最近一次签到之前的总签到数和唯一用户数,αβ是权重因子,用于平衡用户数量与签到数量、近期记录与旧记录的相对相关性,且0α,β$\leq$1。这种定义综合考虑了多方面因素,能更精确地衡量 POI 的流行度。
  2. SEAGET 结构:SEAGET 模型基于轨迹流图,结合了图神经网络(GNN,Graph Neural Network)和注意力模块。GNN 利用轨迹流图创建 POI 嵌入,学习地理和时间相关性;注意力模块增强了对用户移动模式的理解,生成转移注意力图,有效表示 POI 之间的转移可能性。同时,模型还包含上下文模块,融合了时间编码、POI 类别嵌入、季节嵌入和用户嵌入,提高了预测的准确性。通过创建签到嵌入向量,并利用多层感知器(MLP)头和 Transformer 编码器进行预测,最后结合转移注意力图和操作时间过滤器,得到最终的推荐结果。
  3. 实验评估:研究人员使用 Mean Reciprocal Rank (MRR) 和 Accuracy@k (Acc@k) 作为评估指标。Acc@k 用于评估实际 POI 是否在推荐的前 k 个 POI 中,公式为 Acc@k = m1i=1mI(rankk);MRR 考虑了准确推荐在有序列表中的位置,公式为 MRR = m1i=1mrank1 。实验结果表明,在不同的αβ组合下,SEAGET 模型在大多数准确性测试中优于基线模型,如矩阵分解(MF,Matrix Factorization)、基于矩阵分解和马尔可夫链的 FPMC(Factorization Machines with Personalized Markov Chains)、长短期记忆网络(LSTM,Long Short - Term Memory)等。这证明了 SEAGET 模型在捕捉用户行为和 POI 流行度复杂动态方面的有效性,能够提供更及时、相关的推荐。

研究结论和讨论


SEAGET 模型在 POI 推荐领域取得了显著进展。它强调了季节变化和 POI 运营时间在推荐过程中的重要性,通过重新定义流行度、整合多种信息和先进的模型结构,提升了预测的准确性。然而,该研究也面临一些挑战和限制。例如,数据集仅涵盖一年的数据,无法充分评估季节影响;数据集中缺少 POI 的具体运营时间,需要人工收集;模型无法准确处理用户访问模式的动态变化以及 POI 因道路施工等临时不可达的情况,也未能有效平衡同一类别 POI 的客户分布。尽管如此,SEAGET 模型的成果为该领域的进一步研究奠定了基础。未来的研究可以朝着整合更广泛的数据集、考虑更多实时动态因素和用户特定细节的方向发展,以构建更精确、用户友好的 POI 推荐系统,更好地满足旅游和基于位置服务等行业的需求,提升用户体验。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号