基于生成对抗网络填补与个性化联邦学习的CNN-LSTM空气质量指数预测模型研究

【字体: 时间:2025年06月18日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  为解决空气质量预测中数据缺失与隐私保护难题,研究人员提出融合生成对抗网络(GAN)填补与个性化联邦学习(FL)的CNN-LSTM框架(GC-LFF),通过26个城市节点验证,实现MSE 499.16、R2 0.72的高精度预测,为智慧城市环境监测提供隐私安全的分布式解决方案。

  

空气污染已成为全球公共卫生的重大威胁,细颗粒物(PM2.5
)等污染物不仅加剧哮喘、慢性阻塞性肺病(COPD)等呼吸系统疾病,还与心血管事件和认知衰退密切相关。尽管机器学习(ML)技术如随机森林和ARIMAX模型已用于空气质量指数(AQI)预测,但传统方法面临数据缺失、隐私泄露及跨区域泛化能力不足等挑战。尤其在城市级数据共享中,传感器故障导致的数据不完整与隐私保护需求形成矛盾。

针对上述问题,研究人员开发了名为GC-LFF的创新框架,结合生成对抗网络(GAN)的数据填补能力与卷积神经网络-长短期记忆(CNN-LSTM)的时空特征提取优势,在联邦学习(FL)架构下实现分布式训练。该模型通过GAN生成逼真的缺失数据,保留原始统计特性;CNN-LSTM则捕捉AQI的时空依赖性;而个性化FL允许26个城市节点本地化训练,通过加权联邦平均聚合全局知识,最终在保护数据隐私的同时提升预测精度。研究结果发表于《Engineering Applications of Artificial Intelligence》。

关键技术包括:1)GAN填补模块(参数alpha=100、hint_rate=0.9)生成缺失值;2)CNN-LSTM混合模型分析时空模式;3)联邦学习框架(5轮训练,每轮10本地epoch)实现跨节点协同;4)使用MSE、R2
等指标评估性能。数据来自多城市真实AQI监测网络。

结果

  1. 模型性能:剔除异常值后,GC-LFF取得MSE 499.16、RMSE 19.83、MAE 14.41、R2
    0.72,标准差分析证实其稳定性。
  2. 数据填补效果:GAN模块成功重建缺失的PM2.5
    等污染物数据,相关系数达0.9以上。
  3. 联邦学习优势:个性化FL使低数据量城市节点准确率提升23%,且所有节点保护原始数据隐私。

结论与意义
GC-LFF首次将GAN填补与CNN-LSTM-FL结合,解决了空气质量预测中的两大核心问题——数据不完整与隐私约束。其创新性体现在:1)GAN填补避免传统插值法的分布偏差;2)CNN-LSTM捕获PM2.5
等污染物的非线性时空关联;3)FL框架支持跨城市知识共享而无须集中数据。实际应用中,该模型可为政府提供实时污染预警,同时满足《通用数据保护条例》(GDPR)等隐私合规要求。未来可扩展至更多污染物类型及动态节点加入场景。

(注:作者Shweta Roy、Nisha Kandhoul与Sanjay K. Dhurandher未披露所属机构,研究未接受资助。)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号