连接森林、海岸与人们:社交媒体洞察中国自然保护区中人们对自然环境的情绪与健康认知

《Trees, Forests and People》:Linking Forests, Coasts, and People: Social Media Insights into Sentiment and Wellness Perceptions in China’s Nature Reserves

【字体: 时间:2025年10月28日 来源:Trees, Forests and People 2.7

编辑推荐:

  自然保护区的健康感知差异及其驱动机制研究基于54万条社交媒体评论,发现森林和沿海海洋保护区PSI最高(0.82和0.88),但主题分布不同:森林侧重恢复与运动,沿海强调社交与放松,时空分布显示森林在春秋季更受欢迎,沿海夏季峰值明显。SHAP分析表明生态结构(NDVI、步道密度)和气候(温度-湿度指数)是主要驱动因素。建议差异化设计管理策略,动态优化资源配置,并加强多部门协作。

  本研究聚焦于中国国家自然保护区(NNRs)中的游客情感体验与健康感知,通过分析社交媒体上的大量评论数据,揭示了不同类型的自然保护区在游客情感和健康感知上的差异及其背后的影响机制。随着生态文明建设的持续推进,自然保护区在中国国家空间布局和生态安全体系中扮演着不可替代的角色。这些保护区不仅承担着保护生物多样性、维持生态系统服务和传承自然遗产的重要使命,还逐渐被公众视为自然体验、环境教育和健康活动的重要场所。特别是在快速城市化、人口老龄化、慢性病高发以及心理健康压力日益增加的背景下,如何最大化自然保护区的健康促进功能,成为生态学、公共卫生、心理学和城市规划等多个学科关注的焦点。

在政策层面,诸如“健康中国2030”和“国家公园体系试点项目”等战略明确要求将健康促进与生态保护深度融合,旨在将自然保护区转化为满足全民健康需求的创新空间单元。这一趋势不仅契合全球“绿色复苏”和“基于自然的健康”等理念,也为中国自然保护区的管理与健康空间的供给带来了前所未有的机遇与挑战。然而,尽管已有大量研究证实自然环境对健康和情绪调节的积极作用,但对自然保护区中健康相关主题的评估及其情绪形成机制的研究仍显不足,尤其是在方法论体系和数据选择方面。传统依赖问卷调查和半结构化访谈的方法虽然能提供个体层面的见解,但存在数据收集周期长、覆盖范围有限以及难以进行横向比较和时空动态分析等问题。与此同时,社交媒体虽能持续聚合游客反馈并刻画情绪趋势,但多源数据的整合与应用仍不充分,缺乏可扩展、多维度的分析框架。

为弥补这些不足,本研究采用了一种多阶段、多方法的研究框架,结合大规模社交媒体数据,运用自然语言处理、潜在语义分析(LDA)和基于SHAP的可解释机器学习技术,系统分析了不同类型自然保护区的情感与健康感知机制。具体而言,研究对象涵盖了中国474个自然保护区,收集了超过54万条有效评论。这些数据主要来源于抖音(Douyin)和携程(CTrip)等主流社交平台,分别代表了短视频分享和在线旅游服务的特点。通过定制的Python爬虫程序,研究团队系统地获取了与474个自然保护区相关的文本数据,包括用户生成的评论和标题,并进行了标准化的清洗流程。清洗过程包括将文本编码为UTF-8格式、使用jieba库进行中文分词、去除重复内容、广告信息、仅包含表情符号的评论以及非信息性内容,最终保留了549,682条独特且有效的评论用于情感分析。

情感分类采用了一种基于自然语言处理(NLP)的深度学习模型——StructBERT Sentiment Classification(中文版小型模型)。该模型在四个大型中文数据集(BDCI、Dianping、JD二元分类和Waimai-10k)上进行了预训练,能够有效捕捉中文语言的结构和语义特征。相较于BERT、RoBERTa、ALBERT和ERNIE等其他基于Transformer的架构,StructBERT在预训练过程中融入了结构化学习目标,从而增强了其在句法表示方面的性能,同时保持了计算效率。为了减少决策边界附近的噪声,研究采用了概率带技术,将预测概率在0.40至0.60之间的评论归类为中性情感,其余评论则根据最大概率类别进行分类。情感得分范围从0到1,其中0表示高度负面情感,1表示高度正面情感,所有评论被划分为负面(0.0–0.4)、中性(0.4–0.6)和正面(0.6–1.0)三个类别。

为量化健康相关的内容,本研究构建了一个基于潜在语义结构的“健康主题得分”(WTS)。通过LDA主题建模,研究团队对已分类为正面情感的评论进行了主题提取,确定了最优主题数量,并通过相关性和困惑度指标进行评估。研究选择了平均PSI值最高的两个自然保护区类型——森林和沿海海域——进行进一步分析。每条评论被重新分配到其最可能的主题,随后基于已建立的健康相关主题识别表(包含放松体验、自然沉浸、恢复状态、社交联结和轻度体力活动五个维度)对主题进行健康相关性评估。如果主题的关键词与这些维度匹配,则被归类为“健康相关主题”。

PSI被定义为每个自然保护区中正面评论占总情感标签评论的比例,作为后续统计建模和空间比较分析的核心因变量。研究进一步分析了健康相关主题在不同自然保护区中的时空分布特征。在时间维度上,研究将正面评论的时间戳数据按月汇总,以捕捉健康感知的季节性变化。在空间维度上,研究依据每个自然保护区的经纬度,对健康相关情感进行了地理映射,从而识别出不同自然保护区中健康情感的聚集模式和区域差异。

为了深入理解健康感知的形成机制,研究构建了一套解释变量体系,涵盖自然保护区和区域层面的生态特征、基础设施、季节适宜性、气候指标、社会经济因素和地理属性。在森林保护区中,WTS与植被覆盖度(NDVI)、蓝绿空间比例和香农多样性指数(SHDI)存在显著正相关,而与相对湿度和省份编码存在显著负相关。对于沿海海域保护区,WTS与蓝绿空间比例、温度湿度指数(THI)和主要游览季节存在显著正相关,而与相对湿度和PM?.?浓度存在显著负相关。研究还发现,社会经济和地理变量在森林和沿海海域保护区中均表现出中度正相关,表明这些变量在不同区域对健康感知的影响具有一定的普遍性。

基于SHAP的分析进一步揭示了森林和沿海海域保护区健康感知驱动因素的重要性层级差异。在森林保护区中,生态特征(如NDVI和SHDI)对WTS的正向影响最为显著,而空间基础设施变量(如步道密度和非机动路径长度)也显示出重要贡献。相比之下,沿海海域保护区的健康感知主要由气候和地理位置因素驱动,其中蓝绿空间比例和温度湿度指数在模型输出中具有高度集中和正向的贡献。此外,研究还发现,不同变量在不同时空和社会情境下可能表现出协同、替代或补偿效应,这表明提升健康感知的路径并非单一,而是需要结合自然保护区的生态基础和社会经济条件进行优化。

研究结果表明,森林保护区的游客情感更倾向于恢复性和沉浸感,而沿海海域保护区则更强调社交联结和放松体验。这种差异不仅源于生态系统的不同特征,还与游客的社会心理属性和文化背景密切相关。在中国传统文化中,森林和湿地常被视为健康养生和精神修养的理想场所,这强化了游客对这些自然保护区的正面期待和情感反应。而沙漠和野生动物保护区则更多地被视作探险、好奇或科学探索的空间,导致游客的情感体验更加多样化和不确定。这种社会文化机制进一步放大了不同类型自然保护区之间的情感差异。

从时空分布来看,森林和沿海海域保护区在健康感知上表现出显著的差异。森林保护区主要分布在资源丰富、气候温和的地区,为游客提供了理想的身心恢复环境,尤其是在春季和秋季。而沿海海域保护区由于其独特的地理位置和节假日的影响,成为夏季休闲和旅游的热门目的地。这种时空差异不仅反映了生态系统本身的吸引力,还受到人口流动性、节假日政策和旅游市场偏好等因素的影响,显示出健康体验对区域发展和社会结构的高度敏感性。

此外,研究还指出,健康感知的形成是多种因素复杂耦合和动态调节的结果。生态、气候、基础设施、经济和社会因素之间的相互作用构成了健康感知的多维驱动体系。在某些情况下,基础设施可以部分弥补生态或气候条件的不足,而在其他情况下,优越的生态条件可能使得基础设施的边际贡献减弱。因此,提升健康感知的策略应根据自然保护区的具体生态基础和社会经济条件进行优化,以实现健康服务的精准供给和可持续发展。

本研究的理论和方法论创新为健康感知机制的解释提供了新的视角。通过将LDA主题建模与基于SHAP的可解释机器学习相结合,研究突破了传统变量独立性和线性因果关系的局限,能够识别和解释变量之间的非线性和条件性效应。例如,蓝绿空间比例超过一定阈值后,温度湿度指数的提升才可能产生正面的健康效应,这种“阈值效应”和“条件依赖性”难以通过传统方法捕捉。此外,研究还强调了跨学科合作和政策创新的必要性,以推动健康管理体系的持续发展。单一部门或传统自然保护区管理模式难以满足健康服务的复杂性和多样性,因此需要加强政府、健康、文化旅游和社区等多方面的协调,形成从顶层设计到基层实施的闭环政策框架。

最后,研究建议建立基于数据和证据的管理评估与动态反馈机制,以持续监测健康服务的实际效果和游客需求变化,从而实现管理策略和服务内容的及时调整。通过持续评估和用户反馈,健康产品的设计和服务流程可以动态优化,以不断提升游客满意度和健康收益。同时,研究还指出,自然保护区中的健康服务对区域社会公平和弱势群体福祉具有重要贡献,应推动健康资源的包容性共享,实现自然保护区健康价值与社会价值的双重提升。

尽管本研究在方法和数据上具有一定的创新性,但仍存在一些局限性。首先,尽管大规模社交媒体数据能够捕捉广泛的游客健康感知,但这些数据可能偏向于活跃的或年轻的互联网用户,从而低估了老年人、农村居民或数字连接度较低群体的体验和情感。其次,情感分析和主题建模方法虽然能够提取主要健康主题,但不可避免地涉及一定的主观性,可能忽略一些细微或情境依赖的情感表达。此外,由于数据的横断面性质,本研究主要揭示了环境因素与健康感知之间的相关性,而非因果关系,因此时间动态和长期影响仍需进一步探索。最后,尽管研究结合了可解释机器学习和语义分析,但未来研究可以进一步整合生理、行为或调查指标,以验证和三角验证健康结果。此外,自然保护区的多样性及其管理实践可能限制研究结果在其他国家或文化背景下的推广。

综上所述,本研究系统评估了中国自然保护区的健康感知及其驱动机制,为优化健康服务和实现精准管理提供了科学依据和实践指导。研究结果揭示了不同类型自然保护区在情感体验、时空分布和主题结构上的显著差异,强调了生态结构、气候、基础设施和社会经济因素在健康感知形成中的协同作用。基于SHAP的分析进一步凸显了变量之间的非线性和阈值机制,强调了协调与差异化管理的必要性。尽管存在数据来源和研究设计方面的局限,未来研究应通过整合生理和行为指标、拓展样本多样性以及采用纵向研究设计,进一步明确基于自然的健康感知机制及其长期影响。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号