《Journal of Industrial Information Integration》:Implementing TinyML in Internet of Things Devices: A Systematic Literature Review
编辑推荐:
TinyML在物联网中的应用及挑战研究:通过PRISMA协议系统综述了114项研究,发现TinyML依托深度学习模型(CNN、LSTM等)在医疗、环境监测等领域实现本地化数据处理,显著提升隐私与实时性,但面临安全漏洞、算法偏见及硬件资源限制等挑战。
安德烈斯·费利佩·索利斯·皮诺(Andrés Felipe Solis Pino)|丹尼尔·史蒂文·莫兰·皮萨罗(Daniel Steven Moran Pizarro)|巴勃罗·H·鲁伊斯(Pablo H. Ruiz)|瓦内萨·阿格雷多-德尔加多(Vanessa Agredo-Delgado)|塞萨尔·阿尔贝托·科拉索斯(Cesar Alberto Collazos)|费尔南多·莫雷拉(Fernando Moreira)
科姆法考卡大学工程学院(Facultad de Ingeniería, Corporación Universitaria Comfacauca - Unicomfacauca),地址:哥伦比亚考卡省波帕亚恩(Popayán)190001,4号街8-30号
摘要
物联网(Internet of Things, IoT)处于社会发展的核心地位,并正在经历快速扩张。它与人工智能(Artificial Intelligence, AI)和机器学习(Machine Learning, ML)的结合催生了“微型机器学习”(Tiny Machine Learning, TinyML)技术,该技术能够在设备端直接处理数据,从而提高效率、减少延迟并增强数据隐私保护。尽管TinyML在物联网中的重要性日益凸显,但目前仍缺乏系统性的文献综述来全面阐述其应用、进展及面临的挑战,这阻碍了人们对现有实证证据和最佳实践的清晰理解。为填补这一空白,本研究遵循PRISMA协议并采用多数据库搜索策略,共识别出114篇原始研究文献。研究发现,自2020年以来,TinyML作为物联网的变革性范式发展迅速,应用领域广泛,医疗健康和环境监测是其典型代表。深度学习模型(尤其是卷积神经网络,Convolutional Neural Networks, CNN)在这一领域被频繁使用。主要挑战包括安全漏洞、算法偏见等伦理问题以及与内存和处理能力相关的硬件限制。总体而言,本综述为研究人员、开发者和决策者提供了关于物联网中TinyML现状和前景的宝贵见解。
引言
物联网(Internet of Things, IoT)是指嵌入日常物品中的互连计算设备网络,使这些设备能够交换数据[1]。近年来,其在社会中的重要性呈指数级增长,预计到2029年,将有约365亿台设备通过该技术实现互联互通[2]。物联网在医疗健康、农业、工业自动化和创新城市环境等领域具有广泛应用[3]。同时,它被视为第四次工业革命的关键组成部分,通过实时收集和分析大量数据来优化和自动化各种流程[4]。此外,将物联网与其他关键技术(如人工智能AI和机器学习ML)相结合,正在改变企业的运营方式和决策过程[5]。
物联网与人工智能技术的融合提升了设备的功能,实现了数据收集、自主分析和独立决策,进而催生了“物联网中的人工智能”(AIoT)[6]。其中,作为AI最广泛应用的机器学习(Machine Learning, ML)对物联网产生了深远影响[7]。这种技术组合使得在资源有限的设备(如传感器和微控制器MCU)上实现机器学习模型成为可能[8],从而诞生了“微型机器学习”(Tiny Machine Learning, TinyML)概念[9]——这种技术允许数据在采集地直接处理,减少了将大量数据传输到云端的需要[10]。这种方法增强了设备的自主性,实现了近乎即时的数据处理和强大的数据隐私保护,降低了对外部网络连接的依赖性,并提升了实时响应能力[8,11]。尽管TinyML仍处于发展阶段,但已在健康参数监测、精准农业和智能家居等领域展现出广阔的应用前景[12,13]。
在这一背景下,针对物联网生态系统中TinyML应用的研究取得了令人鼓舞的成果[12,14,15,16],但其相关学术文献仍较为匮乏。尽管已有部分综述探讨了物联网中TinyML的特定方面[6,8,11,17],但缺乏系统性的综合评估,无法全面理解该技术的实施情况、进展及未来研究方向。鉴于该领域的复杂性和快速发展特性,亟需开展深入分析,以明确人工智能技术在物联网设备中的应用和实现方式。
尽管已有众多调查和综述,但仍缺乏系统性的、基于证据的综合性研究来全面解析TinyML的实现机制。为此,本研究遵循PRISMA协议进行了系统性的文献综述,识别出114篇原始研究文献。研究结果表明,自2020年以来,TinyML作为物联网的变革性范式取得了显著进展。其应用领域多样,尤其是在医疗健康和环境监测方面。深度学习模型(尤其是卷积神经网络)在TinyML中得到广泛应用。主要挑战包括安全漏洞、算法偏见等伦理问题以及硬件资源限制(如内存和处理能力)。总之,本综述为相关领域的研究人员、开发者和决策者提供了重要参考。
参考文献综述
物联网中微型机器学习的实现
物联网中微型机器学习(Tiny Machine Learning, TinyML)的研究仍处于活跃发展阶段,部分综述仅探讨了相关技术的基本应用,而系统性研究则较少深入分析。以下是一些与该研究相关的文献:
Dutta和Bharali的综述[11]探讨了TinyML在物联网中的集成情况。
系统文献综述规划
本研究属于系统性文献综述,旨在通过定量和定性分析相关科学文献,系统地总结该领域的实证证据[19]。研究重点关注TinyML技术在物联网设备中的应用,包括所使用的算法、主要部署平台以及该领域存在的局限性(见图1)。
为完成此次综述,我们对PRISMA协议进行了适当调整。
综述实施过程
系统性文献综述的执行严格遵循既定流程。使用Parsifal平台[25]管理整个研究过程,整个过程分为三个基本阶段。
在第一阶段,利用litsearchr计算工具和PICOC评估标准,在指定的文献数据库中进行了文献搜索。
结果与分析
本研究通过多数据库搜索策略,分析了物联网设备中TinyML技术的实现情况。在完成文献综述后,对分析结果进行了定量评估,并通过定性分析回答了研究问题,明确了领域内的空白之处。
结果讨论
本综述详细分析了物联网生态系统中微型机器学习(TinyML)的发展现状。结果表明,TinyML在边缘计算(edge computing)领域具有提升数据分析能力的潜力[70],且自2020年以来相关研究数量显著增加,进一步凸显了其在物联网中的重要性。深度学习模型(尤其是卷积神经网络CNN和长短期记忆网络LSTM)在该领域占据主导地位[70,49],反映了当前研究趋势。
有效性评估
本研究分析了物联网中微型机器学习(TinyML)的实现方式,以识别相关模式。在此过程中,我们注意到遵循PRISMA协议中提出的有效性评估标准的重要性:
•数据库和搜索偏见:搜索策略旨在覆盖七大主流科学数据库,但部分重要研究可能收录在专业性更强或属于灰色文献(如学位论文)的数据库中。
结论与未来工作
本系统文献综述利用PRISMA协议,对物联网中微型机器学习的实现情况进行了全面分析。研究共识别出114篇原始文献,深入探讨了该领域的关键趋势、挑战及未来发展方向。研究表明,微型机器学习正在成为物联网的变革性技术,推动着该领域的创新发展。
作者贡献
概念框架的构建由A.F.S.P.、D.E.M.P.、P.H.R.、F.M.、C.A.C.和V.A.D.共同完成;方法论设计由A.F.S.P.、D.E.M.P.、P.H.R.、F.M.、C.A.C.和V.A.D.负责;软件开发由A.F.S.P.、D.E.M.P.、P.H.R.、F.M.和V.A.D.完成;验证工作由A.F.S.P.、D.E.M.P.、P.H.R.、F.M.、C.A.C.和V.A.D.负责;文本撰写与编辑工作由A.F.S.P.、D.E.M.P.、P.H.R.、F.M.和V.A.D.共同完成。所有作者均审阅并同意最终发布的稿件内容。
数据可用性声明
缩写说明
- AI:人工智能(Artificial Intelligence)
- AIoT:物联网中的人工智能(Artificial Intelligence of Things)
- BLE:低功耗蓝牙(Bluetooth Low Energy)
- CNN:卷积神经网络(Convolutional Neural Network)
- GRU:门控循环单元(Gated Recurrent Unit)
- IoT:物联网(Internet of Things)
- LSTM:长短期记忆网络(Long Short-Term Memory)
- MCU:微控制器单元(Microcontroller Unit)
- ML:机器学习(Machine Learning)
PRISMA:系统性综述与元分析的推荐报告项目(Preferred Reporting Items for Systematic Reviews and Meta-Analyses)- RNN:循环神经网络(Recurrent Neural Network)
- SBC:单板计算机(Single-Board Computer)
SVM:支持向量机(Support Vector Machine)- TFLM:适用于微控制器的TensorFlow Lite版本
- TinyML:微型机器学习(Tiny Machine Learning)
CRediT作者贡献说明
安德烈斯·费利佩·索利斯·皮诺(Andrés Felipe Solis Pino):负责文本撰写与编辑、原始稿件撰写、方法论设计、研究调查及概念框架构建;
丹尼尔·史蒂文·莫兰·皮萨罗(Daniel Steven Moran Pizarro):负责文本撰写与编辑、原始稿件撰写、方法论设计、研究调查及概念框架构建;
巴勃罗·H·鲁伊斯(Pablo H. Ruiz):负责文本撰写与编辑、原始稿件撰写、方法论设计、研究调查及概念框架构建;
瓦内萨·阿格雷多-德尔加多(Vanessa Agredo-Delgado):负责文本撰写与编辑、原始稿件撰写、方法论设计、研究调查及概念框架构建;
作者声明
作者声明不存在可能影响本研究结果的财务利益冲突或个人关系。
致谢
我们衷心感谢哥伦比亚国立开放与远程大学(Universidad Nacional Abierta y a Distancia, UNAD)和科姆法考卡大学集团(Corporación Universitaria Comfacauca - Unicomfacauca)提供的研究支持。同时,也非常感谢哥伦比亚科技创新部(Ministerio de Ciencia, Tecnología e Innovación)通过BPIN 202100010029项目提供的资金支持。此外,我们也感谢伊比利亚美洲大学研究生协会(AUIP - Asociación Universitaria Iberoamericana de Postgrado)在研究实习期间给予的帮助。