基于先进机器学习技术的社交媒体社会支持检测研究:从GPT零样本学习到Transformer模型优化

【字体: 时间:2025年05月30日 来源:Heliyon 3.4

编辑推荐:

  针对社交媒体中社会支持(Social Support, SS)检测的难题,墨西哥国立理工学院等机构研究人员开展了一项创新研究。通过构建包含42,695条YouTube评论的数据集,采用Transformer模型(如roberta-base)和GPT系列零样本学习技术,在SS检测、个体/群体支持分类及6类群体细分任务中分别获得0.78、0.84和0.80的宏F1值,较传统CNN+GloVe方法提升0.2%-0.7%。该研究为心理健康干预提供了新工具,发表于《Heliyon》。

  

在数字时代,社交媒体已成为人们获取情感支持的重要渠道,但过度使用也伴随着抑郁、焦虑等心理健康风险。研究表明,线上社会支持(Social Support, SS)可能缓解这些负面影响,然而传统检测方法依赖关键词匹配和浅层特征,难以捕捉复杂的支持性语境。更棘手的是,现有技术面临数据不平衡、多标签分类准确率低等挑战,特别是对少数群体(如LGBTQ、宗教群体)的支持识别效果欠佳。这些瓶颈严重制约了通过算法识别支持性内容来构建积极网络环境的可能性。

墨西哥国立理工学院联合波特兰州立大学等机构的研究团队在《Heliyon》发表了一项突破性研究。他们构建了首个多层级社交媒体支持检测体系,通过创新性地融合Transformer模型与零样本学习技术,在保持数据生态真实性的前提下,显著提升了分类性能。这项工作不仅为计算社会学提供了新工具,更开辟了"用算法放大善意"的研究新范式。

研究团队采用三项关键技术:首先构建包含42,695条YouTube评论的标注数据集,涵盖个体支持与6类群体支持(国家、LGBTQ、黑人社区等)的细粒度分类;其次应用K-means聚类处理数据不平衡问题,比较了平衡与原始数据集的性能差异;最后系统评估了roberta-base等Transformer模型与GPT-3/4/4o的零样本学习效果,采用宏F1-score等指标进行多维度验证。

在"支持性检测"任务中,roberta-base模型以0.78的宏F1-score领先,较传统SVM方法提升3.7%。特别值得注意的是,该模型对非支持性内容(NSS)的识别准确率达90.89%,但对支持性内容存在34.7%的漏检率,反映出算法对负面内容的天然敏感性。通过混淆矩阵分析发现,天气讨论等中性内容最易被误判为NSS,而包含明确鼓励词汇的语句识别效果最佳。

"个体vs群体支持"分类任务展现出更显著的优势,roberta-base取得0.84的宏F1-score,群体支持识别准确率高达94.32%。这一结果印证了社交媒体用户更倾向表达群体支持的假设。有趣的是,28.61%的个体支持被误判为群体支持,暗示个体化表达在公共平台可能自发转化为群体认同。

最具挑战性的"六类群体细分"任务中,模型整体准确率达87.31%,但各类别差异显著:对国家(LGBTQ)的支持识别率超92%,而宗教类仅47.37%,主要与样本量不足(仅18条测试数据)有关。值得注意的是,女性支持类别虽样本量少(24条),仍取得87.5%的准确率,表明语义特征而非单纯数据量决定模型性能。

研究团队尝试用K-means平衡数据集后,发现Task3性能骤降至0.11宏F1-score,揭示过度平衡可能破坏原始数据分布。相比之下,GPT-4o在零样本学习中表现亮眼,三任务分别取得0.68、0.82和0.63的宏F1-score,证明大语言模型在少样本场景的潜力。

这项研究确立了Transformer模型在社交支持检测中的优势地位,特别是roberta-base在保持数据原始分布时表现最佳。其重要意义在于:方法学上,首次系统比较了平衡处理对多标签文本分类的影响,证明特定场景下接受数据不平衡反而更优;应用层面,为构建"支持性内容放大器"而非单纯仇恨过滤器提供了技术路线。局限性在于宗教等少数类别样本不足,未来需整合few-shot学习(小样本学习)与提示工程优化。该成果不仅推进了计算社会科学发展,更为设计"温暖AI"干预网络心理健康开辟了新途径。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号