
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于人工智能与可解释AI的开源数据驱动CO2 排放估算模型研究
【字体: 大 中 小 】 时间:2025年06月13日 来源:Expert Systems with Applications 7.5
编辑推荐:
为解决城市CO2 排放精准评估难题,研究人员利用开源数据与AI技术(XgBoost/GCN)构建了细尺度预测模型,结合可解释AI(XAI)分析关键影响因素。结果显示模型MAPE低至8%,优于现有方案,为可持续城市规划提供了数据驱动的决策工具。
随着全球气候变化加剧,城市CO2
排放作为主要温室气体来源亟待精准量化。传统模型多聚焦交通或能源数据,却忽视城市服务体系的动态影响,且数据获取受限。针对这一瓶颈,中国国家可持续交通研究中心(CN MOST)联合Snap4City平台开发了基于开源数据与人工智能的创新解决方案。
研究团队创新性地采用ODIAC卫星数据作为地面真实值,结合覆盖经济、医疗、交通等13类城市服务的开源数据,构建700×700米网格化评估体系。通过对比XgBoost、GCN等算法性能,发现整合GPS坐标的XgBoost模型表现最优(MAPE=7.79%,R2
=0.96)。研究首次通过Shapley值解析发现:单位面积房价(CostSM)、纳税人数量等社会经济指标对排放预测的影响权重显著高于传统认知的服务设施密度。
关键技术包括:1)多源数据空间对齐(GDAL库实现WGS84坐标转换);2)基于15MinCityIndex的网格化建模;3)XgBoost超参数优化(学习率0.015/树深10);4)图卷积网络(GCN)的3km邻域特征聚合;5)SHAP值驱动的特征重要性分析。
【数据描述与特征分析】
通过主成分分析(PCA)发现,博洛尼亚数据集79.6%方差可由基础设施密度(PC1)和地理坐标(PC2)解释。卫星数据经UTM投影转换后,显示冬季CO2
排放较夏季增加约30%,印证了供暖系统的影响。
【模型定义与评估】
XgBoost在包含GPS数据时表现惊艳(Florence测试集MAPE=10.72%),而通用型ADT模型通过混合训练后仍保持10.23%的误差率,证实了跨城市应用的可行性。
【可解释性发现】
Shap分析揭示:1)每平方米房价每增1k欧元,CO2
预测值提升12%;2)道路长度增长与排放负相关,暗示完善路网或可降低碳足迹;3)EAQI(欧洲空气质量指数)与CO2
呈非线性正相关,反映复合污染协同效应。
该研究突破性地证明:开源数据驱动的AI模型可替代高成本传感器网络,其创新点在于:1)首次整合卫星数据与城市服务多维指标;2)揭示社会经济因素的核心预测价值;3)通过迁移学习实现跨城市泛化。成果发表于《Expert Systems with Applications》,为《巴黎协定》下的城市减排行动提供了可扩展的技术框架,特别适用于数据基础设施薄弱地区。未来工作将探索在线学习机制以增强模型动态适应性。
生物通微信公众号
知名企业招聘