编辑推荐:
为解决传统单一主题检测或情感分析无法全面评估舆情演化的问题,研究人员基于 B 站视频评论,运用分词、共词网络、Louvain 算法及朴素贝叶斯(Naive Bayes)开展紧急事件热度与舆情演化研究,发现关键节点并划分阶段,为应急管理提供多阶段策略。
在信息爆炸的时代,社交媒体成为紧急事件舆情传播的重要阵地。当自然灾害、公共卫生事件等突发危机发生时,网络上的信息往往呈现碎片化、情绪化的特点。传统的舆情监测多聚焦于单一主题检测或简单的情感分析,难以全面捕捉事件热度的波动规律与公众情绪的复杂演变,导致无法及时、精准地识别关键节点和引导舆论。例如,在面对重大公共卫生事件时,单一的情感分析可能无法关联到不同阶段的热点话题变化,从而影响应急响应的时效性和有效性。因此,如何整合多维度数据,动态追踪紧急事件的热度与舆情演化路径,成为公共安全与数据科学领域的重要挑战。
为了攻克这一难题,研究人员围绕紧急事件的热度与舆情演化展开深入研究。虽然文中未明确提及具体研究机构,但通过对 B 站(Bilibili)平台上四类紧急事件(自然灾害、事故灾难、公共卫生事件、社会安全事件)的视频评论数据进行分析,旨在构建一种融合主题检测、热度分析与情感计算的综合模型。该项研究成果发表在《International Journal of Cognitive Computing in Engineering》,为紧急事件的舆情管理提供了新的视角和方法。
研究人员采用了一系列关键技术方法:首先,通过网络爬虫技术收集 B 站上与紧急事件相关的评论数据,涵盖文本内容、发布时间等元数据;其次,运用自然语言处理技术对数据进行预处理,包括分词、去停用词等操作,构建共词网络(Co-word Network),并利用 Louvain 算法进行主题划分,识别出不同紧急事件的核心话题社区;然后,基于主题词与文档词的重叠度计算主题热度(Heat),通过时间序列分析和 3σ 原则检测热度异常点,定位引发公众讨论的热点事件;最后,借助朴素贝叶斯(Naive Bayes)算法进行情感分析,将情感值映射到 [-0.5, 0.5] 区间,生成情感时间序列,划分情感演化阶段。
4.1 主题检测
研究人员对郑州暴雨、东航客机事故等事件的评论进行分词和社区检测,利用 Louvain 算法(分辨率参数 1.2)识别出多个高模块化社区。例如,郑州暴雨事件衍生出 “抗险救灾”“灾情状况”“救援行动” 等 6 个主题;东航客机事故涉及 “真相调查”“民众哀悼”“飞机状况关注” 等 3 个主题。通过提取各社区前 15 个节点作为关键词,明确了不同事件的核心讨论焦点。
4.2 热度异常点检测
通过计算主题热度时间序列,研究发现不同事件的热度波动差异显著。以韩国梨泰院踩踏事件为例,10 月 30 日多个主题热度激增,关联到 “政府反思庆典安全”“总理宣布全国哀悼” 等热点事件。研究采用 3σ 原则确定异常阈值(b=2),有效识别出各事件中引发公众关注的关键时间节点,如郑州暴雨中的地铁灌水事件、唐山打人事件中的嫌疑人全部落网等。
4.3 情感计算与分布
基于 SnowNLP 的朴素贝叶斯模型,研究对评论情感进行量化分析,将情感演化划分为 “初始 - 爆发 - 稳定 - 恢复” 阶段。韩国梨泰院事件中,事件爆发期情感值快速上升且波动剧烈,稳定期逐渐回落;东航客机事故中,“找到黑匣子” 的积极事件与 “民众哀悼” 的消极事件并存,导致整体情感值趋于中性。这表明同一事件中不同主题的情感极性可能相互中和。
4.4 主题与情感的时间关联
分析发现,主题热度与情感值总体趋势同步,但存在特殊情况。例如,东航事件中,3 月 21-25 日与 25-28 日情感值变化相似,但前者因正负情感事件交织导致热度差异显著。这揭示了公众情绪对多维度事件的复杂响应机制,即单一事件的情感极性可能被其他事件稀释。
研究结论表明,该模型能够有效揭示紧急事件的演化轨迹,通过整合主题热度与情感时间序列,可精准定位热点事件并划分舆情阶段。对于管理部门而言,可采取 “预防 - 调整 - 恢复” 三阶段策略:在舆情形成期利用监测工具预警潜在热点;爆发期通过官方渠道发布准确信息,抑制谣言传播;稳定恢复期响应公众诉求,修复公信力。此外,研究指出当前方法依赖人工阈值设定和单平台数据,未来需拓展多平台验证及智能算法优化。
这项研究为紧急事件的舆情管理提供了数据驱动的科学方法,其融合多技术的分析框架不仅提升了应急响应的精准度,也为跨平台舆情监测和公共安全决策提供了理论支撑。随着大数据技术的发展,该模型有望在更广泛的紧急事件场景中发挥预测与引导作用,助力构建更具韧性的社会安全防护体系。