
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用深度学习识别网络欺凌行为的预测因素:一种针对类别不平衡问题的加权损失两阶段训练方法
《BMC Psychology》:Identifying predictive factors of cyberbullying perpetration via deep learning: a two-stage training approach to class imbalance with weighted loss
【字体: 大 中 小 】 时间:2026年06月14日 来源:BMC Psychology 3
编辑推荐:
摘要背景尽管机器学习已被广泛用于研究网络欺凌等不良行为,但行为数据集中的类别不平衡问题依然存在。本研究基于一般攻击模型和社会生态学框架,试图通过一种结合两阶段训练策略与类别加权损失函数的深度学习框架,提升对网络欺凌实施者的识别能力。方法研究从多所学校招募了660名中国大学生,其中
尽管机器学习已被广泛用于研究网络欺凌等不良行为,但行为数据集中的类别不平衡问题依然存在。本研究基于一般攻击模型和社会生态学框架,试图通过一种结合两阶段训练策略与类别加权损失函数的深度学习框架,提升对网络欺凌实施者的识别能力。
研究从多所学校招募了660名中国大学生,其中包括54名自称有网络欺凌行为的人。
该深度学习模型的召回率为0.92,显著优于LightGBM和随机森林等传统方法,后者在处理少数类问题时召回率较低。SHAP分析表明,屏幕使用时间、负面情绪、与学校的联系程度、在线时的抑制力减弱、接触暴力媒体以及与不良同伴的交往是最具影响力的预测因素。交互作用分析显示,与学校的联系程度可能有助于减轻多种风险因素的影响。
该框架有效解决了网络欺凌检测中严重的类别不平衡问题,不仅具备出色的性能,还能为预防工作提供可解释的参考依据。
尽管机器学习已被广泛用于研究网络欺凌等不良行为,但行为数据集中的类别不平衡问题依然存在。本研究基于一般攻击模型和社会生态学框架,试图通过一种结合两阶段训练策略与类别加权损失函数的深度学习框架,提升对网络欺凌实施者的识别能力。
研究从多所学校招募了660名中国大学生,其中包括54名自称有网络欺凌行为的人。
该深度学习模型的召回率为0.92,显著优于LightGBM和随机森林等传统方法,后者在处理少数类问题时召回率较低。SHAP分析表明,屏幕使用时间、负面情绪、与学校的联系程度、在线时的抑制力减弱、接触暴力媒体以及与不良同伴的交往是最具影响力的预测因素。交互作用分析显示,与学校的联系程度可能有助于减轻多种风险因素的影响。
该框架有效解决了网络欺凌检测中严重的类别不平衡问题,不仅具备出色的性能,还能为预防工作提供可解释的参考依据。