
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自然语言处理与网络爬虫的文化生态系统服务自动识别框架
【字体: 大 中 小 】 时间:2025年09月05日 来源:Ecosystem Services 6.6
编辑推荐:
本文创新性地提出结合网络爬虫(web scraping)、文本挖掘(text mining)与统计分析的框架,通过谷歌地图(Google Maps)平台4760条用户评论,运用BERTopic主题建模和假设检验,实现了文化生态系统服务(CES)的自动化评估,为替代传统问卷调查提供了高效解决方案。
Highlight
本研究通过自然语言处理(NLP)技术,成功利用谷歌地图用户评论数据识别文化生态系统服务(CES),为生态服务评估提供了自动化解决方案。
Study area
研究选取捷克共和国五个生态重点区域:?umava和Podyjí国家公园,以及Moravsky kras(摩拉维亚喀斯特)、Pálava和??árské vrchy保护区。这些区域以生物多样性高、游客密集和景观文化价值丰富为特点(图1)。
Data collection
采用Python 3.12和Selenium 4.20.1库开发网络爬虫程序,仅采集谷歌地图公开评论数据,未涉及任何隐私信息或权限突破。
Results
图7显示BERTopic模型提取的12个高频主题,包括"洞穴""葡萄酒庄园""骑行""徒步旅行"等,通过c-TF-IDF分值量化术语相对重要性。
Discussion
证实谷歌地图文本数据在CES评估中的有效性,其自然语言处理(NLP)方法可替代传统问卷调查,并揭示不同区域CES的显著差异。
Conclusion
本研究构建的NLP框架能高效识别生态系统服务特征,为政策制定和生态旅游管理提供数据支持。
(注:翻译保留专业术语如c-TF-IDF、BERTopic等,省略文献引用标识[xx]及图示标识Fig.x)
生物通微信公众号
知名企业招聘