基于最长均匀子序列的时间间隔依赖性数据增强在序列推荐中的应用研究

【字体: 时间:2025年06月27日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  针对序列推荐(SR)中全局时间间隔方法忽略局部兴趣波动的问题,研究人员提出最长均匀子序列插入(LUI)和替换(LUS)的数据增强策略,结合傅里叶变换和自监督学习(SSL),在三个基准数据集上验证了LURec模型优于14种基线方法,显著提升了推荐性能。

  

在电商和社交媒体领域,序列推荐(Sequential Recommendation, SR)系统通过分析用户历史行为预测未来偏好,已成为提升商业效益的核心技术。然而,现有研究多关注全局时间间隔的均匀性(如TiCoSeRec),却忽视了用户兴趣的局部动态变化——例如夏季密集购买防晒产品与秋季购买唇膜的短期行为差异。这种局限性导致模型难以捕捉真实场景下的兴趣漂移(preference drift)。更关键的是,跨用户行为间的潜在关联未被充分挖掘,限制了推荐多样性和准确性。

针对上述问题,重庆理工大学的研究团队在《Engineering Applications of Artificial Intelligence》发表论文,提出LURec模型。该模型创新性地融合最长均匀子序列插入(Longest Uniform Subsequence Insertion, LUI)和替换(Longest Uniform Subsequence Substitution, LUS)策略,首次实现全局与局部时间间隔的协同优化。通过傅里叶变换整合高低频序列特征,并引入自监督学习缓解数据稀疏性,实验证明LURec在三个基准数据集上超越14种主流方法,为SR领域提供了兼顾时序一致性与兴趣波动捕捉的新范式。

关键技术方法
研究采用多阶段技术路线:1) 单用户序列中基于时间间隔均匀性识别最长局部子序列,插入相似项(LUI);2) 跨用户序列间交换最长均匀子序列构建伪交互数据(LUS);3) 结合傅里叶变换的Beyond Self-Attention机制,通过高通滤波抑制过平滑;4) 对比自监督学习框架增强噪声鲁棒性。数据来源于公开电商行为日志,涵盖不同长度偏态分布的序列。

研究结果

  1. 动机验证
    通过用户季节性购物案例(如防晒产品连续购买)证实,传统全局均匀化会引入无关项(如秋季插入防晒品),而LUI能保持局部兴趣一致性。跨用户分析显示,共享三物品以上的子序列蕴含潜在群体行为模式。

  2. 方法论创新

  • LUI机制:在单序列中定位时间间隔标准差最小的最长子段,插入与上下文语义相似的物品(如夏季子序列插入防晒霜)。
  • LUS策略:跨用户匹配相同物品三元组,用最均匀的子序列替换目标片段,提升交互密度。
  • 频域融合:傅里叶变换将序列分解为低频(全局趋势)和高频(局部波动),通过可学习的重缩放器(rescaler)平衡信息。
  1. 实验验证
  • 性能对比:在Amazon-Beauty等数据集上,LURec的NDCG@10提升8.3%-12.1%,尤其擅长处理短序列(长度<15)。
  • 消融实验:LUS对稀疏数据效果显著(HR@5提升19.7%),而LUI在密集数据中优势更明显。
  • 鲁棒性:噪声注入测试显示,SSL模块使模型在20%噪声比例下性能仅下降4.2%。

结论与意义
该研究突破性地将局部时间间隔动态与跨用户行为关联纳入SR框架,提出的LUI/LUS策略形成互补:LUI强化短期兴趣表征,LUS扩展行为多样性。频域-时域联合建模(Beyond Self-Attention)为解决序列过平滑提供了新思路。实际应用中,该方法可精准捕捉季节性消费等场景的细微变化,为电商平台优化库存管理和个性化营销提供理论支撑。未来工作将探索动态时间间隔阈值与多模态行为数据的融合。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号