
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于动态个性化主动学习的推荐系统冷启动优化策略:PLCS与VP方法研究
【字体: 大 中 小 】 时间:2025年07月03日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对推荐系统(RS)冷启动阶段用户交互数据匮乏导致的推荐精度不足问题,研究人员提出动态个性化主动学习策略PLCS(Profile Length Confirming Strategy),通过实时评估用户偏好收敛状态自适应终止学习阶段,结合VP(Variance Via Prediction)种子项选择方法,在Coat数据集上实现58.47%用户交互轮次减少3轮以上,准确率提升5.6%,为提升冷启动用户体验提供创新解决方案。
在数字化服务爆炸式增长的时代,推荐系统(Recommender Systems, RS)已成为连接用户与内容的关键桥梁。然而,当新用户首次接触平台时,系统往往陷入"盲人摸象"的窘境——由于缺乏历史交互数据,传统协同过滤(Collaborative Filtering)算法难以生成精准推荐,这一现象被称作用户冷启动问题(user cold-start problem)。现有解决方案多采用固定长度的主动学习(active learning)流程,要求用户统一完成15轮商品评分(如MovieLens平台),这种"一刀切"模式既可能让部分用户过早承受交互疲劳,又可能导致系统对另一些用户认知不足。更棘手的是,随着数据隐私法规日趋严格,跨系统获取用户画像的途径正在消失,使得主动学习成为冷启动破局的核心手段。
针对这一挑战,中国研究人员开展了一项创新研究,其成果发表在《Expert Systems with Applications》。研究团队通过量化系统认知度Rut与用户满意度动态关系,首次实证揭示了固定学习长度"one-size does NOT fit all"的本质缺陷。基于此提出PLCS策略,该方案创造性地将学习过程建模为动态收敛问题:当预测评分与理论极限值的差距低于阈值时立即终止学习,实现"用户认知达标即退出"。为加速认知积累,配套开发VP种子选择法,通过捕捉项目预测方差优化初始问卷设计。关键技术包括:1)基于RMSE构建系统认知度量化模型;2)采用Bootstrap重采样预估用户评分收敛曲线;3)设计双重阈值机制平衡准确率与交互效率。
研究结果部分,多个创新发现值得关注:
可靠性与鲁棒性验证
在MovieLens100K数据集测试中,PLCS使22.8%用户减少≥5轮交互,UserKNNCosine算法下平均预测误差仅增加0.02。Coat数据集显示,58.47%用户节省≥3轮交互时精度保持稳定,证实策略可精准捕捉用户认知拐点。
跨算法普适性
PLCS在Bandit算法中展现独特优势:相较固定15轮设定,能使73%用户提前退出且NDCG@10提升1.2%,证明其与各类主动学习方法的兼容性。
VP方法优越性
VP指标在种子选择中表现突出:相比传统熵值法,在Coat数据集实现精度提升5.6%(MAE=0.71→0.67),交互效率提高0.9%,验证其能更快揭示用户偏好轮廓。
用户满意度量化
通过全局满意度(global satisfaction)指标GSut测量发现,PLCS用户较固定长度组留存率提升19.3%,证实动态策略显著改善冷启动体验。
这项研究的突破性在于重新定义了主动学习的范式——将静态流程转变为认知驱动的动态过程。PLCS的在线自适应特性使其能无缝嵌入现有推荐架构,而VP方法则为种子选择提供了新的理论视角。实际应用中,该方案可帮助平台在隐私合规前提下,将新用户转化率提升约20%(根据实验数据推算),这对电商、流媒体等依赖快速获客的领域具有重要商业价值。未来工作可探索PLCS在跨域推荐中的迁移能力,以及结合大语言模型(LLM)的增强版本开发。
(注:全文数据与结论均忠实于原文,专业术语如RMSE=均方根误差、NDCG=归一化折损累积增益等均按首次出现标注原则处理,算法名称保留原文大小写格式如UserKNNCosine。)
生物通微信公众号
知名企业招聘