
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于云原生无服务器计算的大规模遥感数据处理框架CSC-RS及其在雅鲁藏布江中游潜在沙尘源识别中的应用
【字体: 大 中 小 】 时间:2025年05月27日 来源:Geomatica
编辑推荐:
针对传统遥感大数据(RSBD)处理方法在可扩展性和效率上的瓶颈,浙江大学团队创新性地提出云原生无服务器计算框架CSC-RS,通过三级并行结构(服务器集群/共享内存/SIMD向量化)实现处理速度8.04倍提升,成功应用于雅鲁藏布江30年潜在沙尘源(PSSs)时空格局解析,为生态治理提供科学依据。
随着遥感技术(RS)和多时相地球观测(EO)技术的成熟,全球遥感数据量呈指数级增长,2020年已达1.3EB。然而,传统桌面软件在处理遥感大数据(RSBD)时面临算力不足的困境,而HPC集群和Spark等分布式框架又存在编程复杂、资源利用率低等问题。Google Earth Engine等在线平台虽提供海量数据支持,但其封闭式API和固定计费模式限制了算法开发的灵活性。在这一背景下,如何构建兼具高性能与弹性的RSBD处理框架,成为推动地球科学研究的核心挑战。
浙江大学团队在《Geomatica》发表的研究中,创新性地提出云原生无服务器计算框架CSC-RS。该框架采用SMFER设计原则(可扩展性Scalability、模块化Modularity等),通过三级并行结构实现突破:顶层利用无服务器计算实现跨实例任务并行,中层采用OpenMP共享内存多线程处理单幅图像,底层通过SIMD向量化加速像素级运算。研究以雅鲁藏布江中游为案例区,处理1991-2022年Landsat系列数据(112景/66.8GB),成功提取潜在沙尘源(PSSs)的时空分布特征。
关键技术方法包括:1)基于Flask构建HTTP触发的无服务器函数;2)采用阿里云OSS实现数据持久化;3)C++开发的高性能处理核心集成SIMD和OpenMP优化;4)Docker容器化部署确保环境一致性。实验使用AMD Ryzen 7和阿里云4核Xeon平台,通过三级并行策略验证性能提升。
性能测试结果
沙尘源时空格局
讨论与意义
该研究首次将云原生无服务器架构与多级并行计算深度融合,突破性解决RSBD处理中的"网络-计算"耦合瓶颈。框架设计中的混合并行策略(inter-function与intra-function并行结合)较传统方案减少80%的函数间通信开销。在生态应用层面,精确识别的PSSs高频区为西藏风沙治理提供靶向定位——中游宽谷段应作为生态修复重点区域。未来工作将优化数据压缩传输协议,并拓展框架在洪涝监测、作物估产等场景的应用验证。
这项研究不仅为RSBD处理提供了新范式,其"云边协同"的设计理念更为地理计算学(Geocomputation)与云计算融合开辟了新路径。CSC-RS的成功实践证明,通过创新计算架构赋能传统地学分析,能够显著提升对全球变化等重大科学问题的响应能力。
生物通微信公众号
知名企业招聘