利用机器学习评估彩票忠诚计划成员赌博问题风险:可行性探究与意义挖掘

【字体: 时间:2025年04月24日 来源:Addictive Behaviors 3.7

编辑推荐:

  赌博问题危害众多,为探究彩票忠诚计划数据能否识别赌博问题个体,研究人员开展以随机森林算法(RF)预测问题赌博的研究。结果显示该算法总体表现尚可但敏感性差,表明彩票忠诚计划是预防赌博问题的良好场所。这为后续研究提供方向。

  在生活中,赌博现象并不少见。在美国,超过 75% 的成年人在过去一年参与过赌博。然而,赌博虽然普遍,但赌博障碍或问题赌博的患病率相对较低,不过,一旦出现问题,危害却不容小觑。那些有赌博问题的人,可能会遭受情感和精神困扰、面临财务破产、引发家庭冲突,还可能出现健康问题,甚至导致工作和学习受影响,更严重的还会涉及犯罪行为。
彩票赌博作为一种常见的赌博形式,在全球都很受欢迎。但它与赌博问题的关系却很复杂。传统彩票和刮刮乐等 “快玩” 彩票有所不同,刮刮乐能立即获得奖励,可能比传统彩票更易引发赌博问题。而且,彩票赌博的风险还和个人整体赌博习惯以及其他风险因素有关,不同人群参与彩票赌博的风险也存在差异。

目前,虽然有筛查项目试图识别有赌博问题的人,但认可度并不高,同时赌博带来的经济危害却广泛存在。在此背景下,利用机器学习进行预测建模,为识别赌博问题个体带来了新的希望。彩票忠诚计划收集了大量玩家数据,若能借助机器学习挖掘其中价值,对预防赌博问题意义重大。于是,来自国外的研究人员开展了相关研究,该研究成果发表在《Addictive Behaviors》上。

研究人员利用美国某州彩票管理机构提供的彩票忠诚计划数据,结合对参与者的调查数据进行分析。在数据处理过程中,运用了数据清洗、合成少数类过采样技术(SMOTE)等手段,采用随机森林(RF)算法构建预测模型,并通过十折交叉验证对模型进行调优,以 F1 分数等指标评估模型性能。

研究结果如下:

  • 样本信息:在 5903 名参与者中,809 人(14%)的赌博问题严重程度指数(Problem Gambling Severity Index,PGSI)评分达到 5 分及以上,这一比例远高于普通人群。而且高风险彩票玩家在年龄、种族、教育、收入和婚姻状况等方面与低风险玩家存在显著差异。从彩票相关数据来看,高风险玩家上传的即开型彩票数量更多、花费金额更高,在一些指标上与低风险玩家也有明显不同。
  • RF 分析:基于 F1 分数,研究人员选定了每棵树使用 6 个特征的 RF 模型,该模型中有 10000 棵树。结果显示,模型整体准确率为 0.87,平衡准确率为 0.67,但敏感性较低,仅为 0.39,这意味着模型难以准确识别真正有赌博问题的个体;不过,模型在特异性方面表现良好,达到 0.94 ,F1 分数为 0.44,整体预测价值一般。
  • 变量重要性分析:研究发现,对预测最重要的变量并非与彩票玩法直接相关,而是其他赌博活动的频率以及人口统计学变量。即开型彩票的玩法对预测赌博风险有一定重要性,且有赌博问题的人平均年龄比无问题的人小 8 岁,低收入人群更易出现赌博问题。

研究结论和讨论部分指出,彩票忠诚计划参与者中 14% 处于中度或更高风险水平,远高于相关荟萃分析的估计值,这表明忠诚计划可能与赌博危害有关。RF 模型虽性能与其他研究相当,但敏感性差,整体表现一般。该研究存在一些局限性,如数据依赖玩家上传、部分参与者数据不足、响应率低、存在较多异常值等。不过,研究仍有一定意义,它显示出在彩票玩家中检测赌博问题的潜力,彩票忠诚计划可作为预防赌博问题的重要场所。后续研究应聚焦于完善风险评估模型,综合考量干预措施的利弊,即使在缺乏精确预测模型的情况下,也应积极探索有效的预防策略。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号