在线情绪脉动:揭示动态社交媒体环境中的情感反应
《ACM Transactions on the Web》:The Pulse of Mood Online: Unveiling Emotional Reactions in a Dynamic Social Media Landscape
【字体:
大
中
小
】
时间:2025年11月07日
来源:ACM Transactions on the Web
编辑推荐:
本研究提出一种基于Transformer的未监督方法,通过时间序列变点检测和主题建模,系统识别并分析社交媒体中公众对线下事件的情感与道德反应。在三个大规模数据集(2020洛杉矶推文、2022美国堕胎权讨论、2022法国总统选举)中验证了方法的有效性,成功捕捉重大事件(如疫情、最高法院裁决)和次要事件(如选举细节、自然灾害),并通过主题建模解释变化原因,强调数据按主题和人群细分的重要性。
在当今社会,社交媒体已经成为人们表达观点、分享信息和讨论事件的重要平台。这种信息环境的丰富性和动态性为研究人员、政策制定者以及企业提供了深入了解社会现象的契机。然而,社交媒体上的信息往往是高度异质化的,涉及广泛的话题和事件,使得从这些数据中理解社会行为变得复杂。为了应对这一挑战,我们提出了一种系统性的方法,用于检测和测量人们对现实事件的情绪反应,并通过基于Transformer的主题模型进一步解释这些反应。我们展示了这种方法在三个不同数据集上的应用效果,包括(1)2020年1月至8月的洛杉矶推文数据,揭示了黑人生命至上运动和新冠疫情对公众心理的深远影响;(2)美国关于堕胎权利的讨论数据,揭示了对罗诉韦德案推翻以及各州堕胎禁令的强烈情绪反应;(3)2022年法国总统选举数据,展示了选民在投票前后的积极情绪与恐惧、批评情绪之间的转变。通过将数据按主题和群体细分,我们有效减轻了在研究集体情绪时可能存在的偏见。我们的方法使得利用在线数据更好地感知和监测公众在危机中的反应成为可能。
社交媒体连接了全球数十亿人,为人们提供了交流信息、表达情感和回应他人观点的平台。随着技术的发展,研究人员、政策制定者和企业家越来越关注如何通过社交媒体数据了解当前社会状况,包括追踪公众对重要议题的意见以及在前所未有的时间和空间尺度上监测人群的福祉。然而,利用社交媒体数据来理解人类行为仍然面临诸多挑战。社交媒体信息环境具有高度的异质性和动态性,某些话题被广泛讨论,而另一些则几乎无人提及。它涵盖了人们对自身生活的自我报告,以及对外部事件的反应。因此,研究者们开发了多种方法来检测社交媒体上的事件,如基于主题检测的Latent Dirichlet Allocation(LDA)和Topic2Vec,利用文本相似性进行文档聚类,研究术语共现和频率分析,以及检测突发性术语。近年来,一些研究者开始将深度学习技术引入事件检测领域,如通过训练循环神经网络来识别社交媒体上的突发新闻谣言,或者使用深度学习分类器与聚类方法结合,实现半监督事件检测。同时,一些研究者还利用图神经网络结合对比损失项来适应事件类别数量的动态变化,并应用图神经网络模型来研究谣言传播和事件扩散。
尽管这些方法主要关注通过识别异常内容模式来检测社交媒体上的事件,但理解公众在这些事件中的情绪和情感动态同样重要。例如,一些研究结合了事件检测与情感分析,以提高社交媒体事件极性检测的准确性。我们的研究进一步拓展了这一方向,专注于识别那些可能对现实行为产生重大影响的情绪和道德事件。我们采用了一种结合事件检测与情感分析的管道,以检测、测量和解释社交媒体上的集体情绪反应。通过使用基于Transformer的语言模型,我们构建了每日情绪和道德情感的聚合时间序列,并利用变化点检测技术来识别情绪反应的突变。同时,我们还通过主题建模技术来解释触发特定情绪反应的现实事件。
为了测量情绪变化的幅度,我们对每个检测到的变化点进行了短期和长期的影响分析。在短期变化分析中,我们采用了中断时间序列分析方法,以计算事件前后情绪和道德情感的变化。对于长期变化,我们则通过计算事件前七天的平均值,并与事件后两周的平均值进行比较,来评估情绪和道德情感的持续变化。这种方法不仅能够识别出重要的事件,还能够捕捉到那些在短时间内可能被忽视的小事件。
在解释变化的过程中,我们选择了BERTopic作为主题建模工具,因为它能够提取出比传统LDA模型更具连贯性的主题。通过比较BERTopic与LDA在不同数据集上的表现,我们发现BERTopic在情感和道德情感的连贯性得分上表现更优,并且在主题多样性方面也优于LDA。对于每个情绪反应,我们提取了与该情绪或道德情感类别相关的主题,并分析了这些主题如何与现实事件相关联。我们发现,将数据按主题和群体进行细分有助于揭示不同事件对不同人群的影响,从而减轻潜在的偏见。
在2020年洛杉矶的推文数据中,我们检测到了多个重要事件,包括新冠疫情的爆发、黑人生命至上运动的兴起以及其他社会、政治和文化变化。这些事件对公众的情绪和道德情感产生了深远的影响。通过分析这些数据,我们发现,新冠疫情不仅导致了负面情绪的增加,还促使人们在道德情感上表现出更多的关心和批评。同时,我们还发现,通过将数据按主题细分,能够更准确地识别出不同话题下的情绪变化,避免了整体情绪分析可能带来的误导。例如,尽管整体推文中积极情绪较多,但这些情绪主要集中在休闲活动的讨论上,而与新冠疫情直接相关的推文则较少表现出积极情绪。
在2022年的美国堕胎权利讨论数据中,我们检测到了多个关键事件,包括最高法院裁定结果的泄露、罗诉韦德案的推翻、各州的堕胎禁令以及选民对中期选举的反应。这些事件引发了强烈的情绪波动,如愤怒、厌恶、恐惧和批评。通过将数据按政治立场进行细分,我们发现,自由派和保守派在情绪反应上存在显著差异。自由派更多地表达了对堕胎权利的支持,而保守派则表现出更多的反对情绪。这种情绪差异不仅反映了不同的政治立场,也揭示了社交媒体在表达和传播不同观点方面的潜力。
在2022年的法国总统选举数据中,我们检测到了选举的第一轮和第二轮,以及与俄乌战争和G7峰会相关的事件。这些事件对公众的情绪和道德情感产生了显著影响。我们发现,在选举前后,公众的情绪反应呈现出明显的转变:选举前情绪较为积极,而选举后则更多地表现出批评和恐惧。这种情绪动态的变化不仅反映了选民对选举结果的期待,也揭示了选举后人们对政治决策的反思和不满。此外,我们还发现,不同候选人之间的讨论主题和情绪反应存在显著差异,表明公众对不同候选人的态度和情感是多元的。
通过分析这些数据,我们发现,将数据按主题和群体进行细分是理解复杂事件影响的重要手段。这种方法不仅能够揭示不同事件对不同人群的具体影响,还能够减轻潜在的偏见。例如,在堕胎权利讨论中,自由派和保守派对同一事件的反应存在明显差异,而在法国总统选举中,不同候选人引发的情绪反应也不尽相同。这种差异强调了在研究集体情绪时,进行数据细分的必要性。
此外,我们的研究还表明,基于Transformer的模型在情绪和道德情感检测方面具有显著优势。相比传统的字典方法,这些模型能够更好地捕捉到复杂的情感表达,并在不同数据集上展现出较高的准确性和稳定性。然而,我们也意识到,这种基于深度学习的方法仍然存在一些局限性,如对数据分布变化的适应能力、对罕见情绪类别的检测效果等。因此,未来的研究可以进一步优化模型的泛化能力,探索更高效的算法来处理大规模社交媒体数据,并结合其他分析技术,如因果分析,以更深入地理解现实事件与在线情绪之间的关系。
总之,我们的研究展示了如何利用社交媒体数据来检测和测量集体情绪反应,并通过主题建模技术来解释这些反应的来源。这种方法不仅能够揭示重要事件对公众情绪的影响,还能够捕捉到那些被传统媒体忽视的小事件。通过将数据按主题和群体进行细分,我们能够更全面地理解社会情绪的复杂性,并为政策制定者提供有价值的洞察,以更有效地制定与公众情绪相契合的政策。未来,我们计划进一步探索因果分析,以更深入地揭示现实事件与在线情绪之间的动态关系,并提高模型在处理不同数据集时的适应性和准确性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号