在大规模数据集上评估线性浅层自编码器

《ACM Transactions on Recommender Systems》:Evaluating Linear Shallow Autoencoders on Large Scale Datasets

【字体: 时间:2025年11月08日 来源:ACM Transactions on Recommender Systems

编辑推荐:

  浅层线性自编码器在推荐系统中表现优异,但扩展性受限。本文提出ELSAA和SANSA等可扩展变体,优化大型稀疏数据集处理能力,并分析数据稀疏性与目录规模对训练效率的影响。实验包含标准性能指标及工业关注的训练时间与内存消耗,为不同规模数据集选择合适模型提供指导。分隔符

  

摘要

线性浅层自编码器由于结构简单且性能优异,在协同过滤基准测试中受到了广泛关注,这些基准测试用于推荐系统。然而,像EASE这样的模型在处理包含大量项目的数据集时存在扩展性不足的问题。本文通过评估几种可扩展的浅层线性自编码器变体(即最近提出的ELSA和SANSA)在代表实际应用的大规模数据集上的表现,解决了这一限制。我们还提出了进一步改进措施,以提高这些模型在大型、稀疏数据集上的扩展性。我们的评估不仅涵盖了标准的离线和在线性能指标,还考虑了训练时间和内存使用等关键工业因素。通过分析数据稀疏性和目录规模的影响,我们为选择适合特定数据集的模型提供了实用的建议。我们已将源代码、训练日志和详细实验说明发布在以下链接:https://github.com/recombee/SparseELSA。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号