
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向计算连续体的分层分布式存储系统设计与性能优化研究
【字体: 大 中 小 】 时间:2025年06月04日 来源:Future Generation Computer Systems 6.2
编辑推荐:
为解决物联网(IoT)数据激增导致的云基础设施延迟和带宽瓶颈问题,西班牙卡洛斯三世大学ARCOS研究团队创新性设计了基于Expand文件系统的分层分布式存储架构。该研究通过整合MQTT协议和syscall拦截技术,实现了跨边缘-雾-云的高效数据传输,在树莓派、ENIGMA模拟器和AWS云平台的多层级验证中展现出优异的性能与能耗表现,为智能城市、医疗健康等实时应用提供了关键存储解决方案。
随着物联网(IoT)设备的爆炸式增长,海量数据实时处理面临严峻挑战。传统云架构因数据传输距离远导致延迟高、带宽紧张,难以满足智能城市、自动驾驶等关键场景需求。尽管雾计算和边缘计算通过就近处理数据缓解了部分压力,但跨层级的数据存储与传输仍存在效率低下、系统割裂等问题。这种"计算连续体"(computing continuum)的碎片化现状,亟需一种能无缝衔接边缘-雾-云三层的智能存储方案。
西班牙卡洛斯三世大学ARCOS研究组的Elias Del-Pozo-Pu?al等人在《Future Generation Computer Systems》发表研究,对原有Expand2并行文件系统进行革新性改造。团队开发了支持MQTT(Message Queuing Telemetry Transport)协议的跨层级存储架构,通过syscall拦截库实现IoT设备透明化写入,并优化了与亚马逊S3云服务的数据传输机制。研究采用四维验证体系:基于树莓派1/4的真实设备能耗测试、超级计算机模拟的极限性能评估、ENIGMA雾计算模拟器的大规模场景验证,以及AWS云服务的实际传输测试。
关键方法
研究团队主要采用:1) MQTT协议实现轻量级设备通信;2) syscall拦截技术透明化集成存储接口;3) 分层部署Expand文件系统于边缘-雾-云架构;4) ENIGMA模拟器进行大规模场景仿真;5) 亚马逊S3 API开发高效云传输模块。
研究结果
State of the art
系统梳理了计算连续体的技术演进,指出现有存储方案在跨层协作、协议适配等方面的不足,为Expand系统改进提供理论依据。
Expand fundamentals
改造后的Expand2突破传统集群限制,通过NFS/FTP协议聚合异构资源,新增的MQTT适配层使其能识别轻量级设备数据流。
Expand IoT design and implementation
创新性提出三层部署模型:IoT设备通过拦截库调用标准文件接口,数据经MQTT传输至雾节点Expand实例,最终通过优化通道同步至云。测试显示较传统TCP/IP方案降低能耗37%。
Evaluation
四维测试验证:树莓派4写入吞吐达48MB/s;超级计算机模拟千级设备时延迟波动<15%;ENIGMA模拟显示系统在80%节点失效时仍保持数据完整;AWS S3传输效率较基线提升2.1倍。
Conclusions
该研究首次实现计算连续体的全栈存储整合,其核心贡献在于:1) 提出支持POSIX标准的跨层透明存储模型;2) 开发低开销MQTT传输模块;3) 验证系统在真实-模拟混合环境中的鲁棒性。相比传统方案,新系统使边缘到云的数据传输效率提升3倍,能耗降低40%,为智能医疗、工业物联网等时敏应用奠定基础。
Felix Garcia-Carballeira团队特别指出,这种架构能有效缓解"最后一公里"数据拥堵问题。未来工作将探索AI驱动的动态数据分级机制,进一步优化冷热数据在连续体中的分布效率。该成果获得西班牙国家研究署TED2021和PID2022项目的持续支持,其开源特性将加速产业界应用落地。
生物通微信公众号
知名企业招聘