气候问题的地理分布:利用社交媒体和可解释人工智能对中国公众关于极端高温言论的大规模分析

《Environmental Impact Assessment Review》:The geography of climate concern: A large-scale analysis of public discourse on extreme heat in China using social media and explainable AI

【字体: 时间:2025年10月22日 来源:Environmental Impact Assessment Review 11.2

编辑推荐:

  本研究通过分析抖音平台348,417条用户评论,结合大语言模型(LLM)和可解释AI(SHAP)技术,揭示极端高温事件中公众关注主题与驱动因素。研究发现,最高气温升高显著促进“健康影响”和“情绪宣泄”讨论,同时社会经济地位与地理环境(如平均海拔)是主题分布差异的主要因素。该成果为动态社会健康影响评估(SIA/HIA)及精准气候沟通策略提供了方法论支持。

  随着全球气候变化的加剧,极端热浪正成为影响公众健康的主要威胁之一。在这样的背景下,理解公众对极端天气事件的看法及其变化趋势对于制定有效的风险沟通策略至关重要。传统的调查和访谈方法虽然在一定程度上能够提供关于公众态度的信息,但它们在规模和时效性方面存在明显不足,难以及时、全面地捕捉到公众在危机发生期间的实时反应。因此,社交媒体平台成为研究公众意见的新途径,为获取大规模、实时的公众讨论数据提供了前所未有的机会。

本研究首次采用计算方法,对中国的极端热浪相关公众讨论进行大规模分析,利用了抖音(Douyin)平台上的348,417条评论数据。研究过程中,我们通过严格的变量缩减流程处理了多重共线性问题,并结合了大型语言模型(LLM)进行主题分类,同时使用了经过多重比较校正的回归模型和可解释性人工智能(SHAP)分析,以识别和解释公众关注的主要驱动因素。通过对这些数据的分析,我们发现公众讨论中最频繁出现的主题(如区域比较)与最受公众支持的主题(如宿命论和互助行为)之间存在显著差异,揭示了潜在的社区价值观。

回归分析的结果表明,极端高温与公众对“健康影响”和“娱乐与情绪宣泄”等话题的讨论之间存在强有力的、统计上显著的关联。SHAP分析进一步揭示了地理背景(如平均海拔)和社会经济状况对公众讨论性质的总体影响最大,这些因素塑造了从旅游相关讨论到社会脆弱性表达的各种内容。研究结果表明,公众对热浪的讨论受到一个多层次因素的影响,从具有统计显著性的气候触发因素到具有高度影响力的经济社会和地理背景。

本研究提出了一种创新的分析方法,通过结合大型语言模型进行深度主题分析与可解释性人工智能(SHAP)进行地理驱动因素分析,构建了一个从简单情绪监测到全面“是什么、在哪里、为什么”的分析框架。这一方法不仅提高了对公众讨论的分析能力,也为制定更加有效的、基于证据的、因地制宜的气候沟通和公共卫生策略提供了关键信息。研究还表明,这种基于社交媒体数据的分析方法具有良好的可扩展性和稳健性,能够广泛应用于不同的环境和社会背景。

本研究的创新性体现在多个方面。首先,从方法论上,我们引入了一种全新的分析流程,将大型语言模型用于深度主题分析,同时结合SHAP技术进行地理驱动因素的分析,超越了传统的简单情绪监测,实现了对公众讨论的全面理解。其次,从概念上,我们提出了一种新的分析框架,区分了讨论频率与公众共鸣,这使得我们能够识别出潜在的社区价值观。最后,从实践上,我们将这一框架应用于动态的健康与社会影响评估(HIA/SIA),展示了如何利用社交媒体数据为制定基于证据的公共政策提供支持。

为了系统地研究极端热浪事件下公众讨论的主题内容和地理驱动因素,我们设计并实施了一个三阶段的方法论框架,如图1所示。第一阶段是数据准备,涉及从抖音平台全面收集和清理用户生成的评论,并整理省级层面的环境和社会经济数据。第二阶段是文本分类,采用了混合方法对评论进行主题分类。第三阶段是建模分析,对分类后的数据进行进一步处理,以识别主题的地理分布及其背后的影响因素。

通过对348,417条评论的自动分类,我们揭示了公众在高温红色预警期间最关注的主题。为了全面展示这些结果,我们采用了两种不同的指标:(1)原始评论数量,反映了每个主题的讨论频率;(2)加权评论数量,衡量了公众对这些主题的共鸣和认可程度。加权评论数量的计算基于评论的互动情况,包括点赞、转发和评论次数等,以更准确地反映公众的真实态度和反应。

研究的主要发现表明,极端热浪的威胁不断上升,因此需要更深入地了解公众的风险认知和讨论,以制定有效的适应和沟通策略。本研究通过对中国公众在官方“高温红色预警”期间的讨论进行大规模、全国性的分析,填补了这一领域的知识空白。利用一种创新的计算框架,我们收集并分类了超过348,417条社交媒体评论,随后对这些数据进行了建模分析,以识别其背后的主要驱动因素。

研究结果还表明,公众对极端热浪的关注与讨论受到多种因素的影响,包括环境因素、社会经济状况以及人口特征。这些因素在不同省份之间表现出显著的差异,从而影响了公众讨论的主题分布。例如,某些省份的公众更关注健康影响,而另一些省份则更倾向于表达情绪或寻求娱乐。这种差异不仅反映了各地的实际情况,也揭示了公众在面对极端天气事件时的不同应对方式和态度。

此外,研究还强调了社交媒体数据在公共卫生和气候沟通中的重要性。通过分析这些数据,我们能够及时了解公众的需求和反应,从而为政府和相关机构提供科学依据,以制定更加有效的干预措施。例如,社交媒体上的讨论可以揭示公众对高温红色预警的认知程度,以及他们对健康影响和情绪宣泄的关注程度。这些信息对于制定针对不同地区、不同人群的沟通策略具有重要意义。

本研究的贡献在于,它不仅提供了对公众讨论的深入分析,还为环境影响评估(EIA)和健康影响评估(HIA)提供了一种新的方法。通过系统地映射社交媒体讨论的主题景观,并识别其背后的关键环境和社会经济驱动因素,我们的研究为制定更加有效的、基于证据的、因地制宜的气候沟通和公共卫生策略提供了关键信息。这种基于社交媒体数据的分析方法具有良好的可扩展性和稳健性,能够广泛应用于不同的环境和社会背景。

研究还指出,尽管传统的调查和访谈方法在获取公众意见方面有一定的价值,但它们在规模、时效性和地理粒度方面存在明显局限。社交媒体平台的普及使得研究人员能够获取大规模、实时的公众讨论数据,从而更准确地捕捉到公众在危机发生期间的真实态度和反应。这种数据的丰富性和多样性为分析公众讨论提供了更广阔的空间,使得研究人员能够更全面地理解公众的风险认知和行为模式。

此外,研究还强调了在制定气候沟通和公共卫生策略时,需要考虑环境暴露和社会脆弱性之间的相互作用。通过分析社交媒体上的讨论,我们能够识别出哪些地区和人群更容易受到极端热浪的影响,以及他们如何应对这些影响。这些信息对于制定针对性的干预措施和沟通策略具有重要意义,能够帮助政府和相关机构更好地满足公众的需求,减少极端天气事件带来的负面影响。

最后,本研究还提出了一个关于如何利用社交媒体数据进行动态健康与社会影响评估的框架。这一框架不仅能够提供实时的公众讨论数据,还能够帮助研究人员识别和解释这些数据背后的驱动因素。通过结合大型语言模型和可解释性人工智能技术,我们的研究为制定更加有效的、基于证据的、因地制宜的气候沟通和公共卫生策略提供了关键支持。这种基于社交媒体数据的分析方法具有良好的可扩展性和稳健性,能够广泛应用于不同的环境和社会背景。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号