
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于动态掩码特征交互建模的电商点击率预测框架FDM:提升表达效率与商业价值
【字体: 大 中 小 】 时间:2025年06月06日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
针对电商CTR预测中特征交互建模存在参数爆炸、表达受限及重要性忽略等问题,新加坡Shopee团队提出Feature Dynamic Masking(FDM)框架。该框架通过动态掩码单元(DMU)生成差异化特征表示,结合相似性权重增强模块(SWE)量化交互重要性,实现高效信息共享。实际部署使订单量(OPU)和交易总额(GMV)分别提升2.76%和2.45%,为推荐系统优化提供新范式。
在电商平台井喷式发展的今天,用户面对海量商品时的选择困境日益凸显。亚马逊、Shopee等巨头每天需要处理数以亿计的商品展示,而点击率(CTR)预测作为推荐系统的核心环节,直接决定了用户能否快速触达心仪商品。传统解决方案如笛卡尔积方法虽能穷举特征组合,却因参数激增导致计算资源不堪重负;矩阵分解(MF)类模型虽节省参数,却受限于浅层结构难以捕捉复杂非线性关系。更棘手的是,现有深度学习模型如PNN(Product-based Neural Network)和CAN(Compositional Attention Network)往往固守原始特征表示,既未优化嵌入质量,也忽视了不同交互的权重差异——就像用同一把钥匙试图打开所有锁具,显然难以精准匹配。
针对这一行业痛点,新加坡国立大学与Shopee公司的研究团队在《Engineering Applications of Artificial Intelligence》发表创新成果。他们开发的Feature Dynamic Masking(FDM)框架通过两大核心技术突破:动态掩码单元(DMU)为每个特征交互生成"定制化"表示,既保留原始嵌入的共享信息,又通过二进制掩码实现差异化激活;相似性权重增强(SWE)模块则引入时间间隔感知机制,量化用户历史行为与目标商品的关联强度。这种"动态配钥匙"的策略,在Shopee搜索系统实战中交出了订单转化率(OPU)提升2.76%、交易总额(GMV)增长2.45%的亮眼成绩单。
关键技术方法上,研究团队首先构建包含用户行为序列和目标商品特征的混合输入空间,通过嵌入层转化为稠密向量。DMU模块采用轻量级多层感知机(MLP)生成动态二进制掩码,控制特征元素的激活状态;SWE模块则计算行为时间衰减系数与语义相似度的加权组合。模型在公开数据集Amazon Electronics和Shopee十亿级工业数据上,与FM(Factorization Machines)、DeepFM等8类基线模型进行对比验证。
Related works
系统梳理了CTR预测的技术演进:早期笛卡尔积方法因5TB级参数量遭遇工程瓶颈;矩阵分解(MF)虽将参数压缩至200GB量级,但线性组合方式难以捕捉高阶交互;深度交叉网络(DCN)等虽引入非线性,却未解决特征表示僵化问题。这些局限凸显FDM框架的创新必要性。
The proposed FDM framework
核心创新DMU模块通过三层结构实现:特征选择器确定交互对象,掩码生成器输出元素级二值门控,最终生成动态特征表示。SWE模块创新性地将用户点击历史与目标商品的时间差(Δt)转化为指数衰减权重,与余弦相似度共同构成重要性系数。这种设计使"用户上周购买的手机"比"两年前浏览的耳机"对当前手机配件推荐产生更大影响。
Experiments
在Amazon数据集上,FDM的AUC(0.812)显著高于DeepFM(0.801)和xDeepFM(0.805);Shopee工业数据测试中,FDM的NDCG@5提升4.2%。消融实验显示,移除SWE模块会使OPU指标下降1.3%,证实时间感知机制的关键作用。
Online deployment and payoff
实际部署面临严峻挑战:基线模型需72小时训练5TB参数,而FDM仅用24小时完成800GB模型训练,推理延迟控制在15ms内。在线A/B测试持续30天,覆盖东南亚6国用户群,最终GMV提升折算年化收益超千万美元。
这项研究为特征交互建模开辟了新方向。FDM框架的优雅之处在于,它像智能调光器般动态调节特征信息的"明暗度",而非简单开关。这种细粒度控制既避免了笛卡尔积的"资源黑洞",又突破了矩阵分解的"表达天花板"。特别值得注意的是,研究团队将学术创新与工业落地完美结合——从SWE模块的时间衰减系数设计,到部署时采用的渐进式模型热更新策略,处处体现工程思维。未来工作可探索多模态特征交互、联邦学习场景下的应用,以及与其他推荐算法(如强化学习)的融合。正如论文结论强调的,FDM的成功印证了"好的特征交互模型应该像优秀的翻译家,既能保留原文精髓,又能针对不同语境灵活调整表达方式"。
生物通微信公众号
知名企业招聘