编辑推荐:
为解决 COPD 管理难题,中国医学科学院 & 北京协和医学院的研究人员开展数字健康技术与 AI 算法在 COPD 中应用的研究。结果显示这些技术在多方面有应用潜力。推荐阅读,助您把握该领域前沿,启发相关科研思路。
中国医学科学院 & 北京协和医学院医学信息研究所 / 医学图书馆的研究人员 Zhenli Chen、Jie Hao 等人在《BMC Medical Informatics and Decision Making》期刊上发表了题为 “Applications of digital health technologies and artificial intelligence algorithms in COPD: systematic review” 的论文。这篇论文对于慢性阻塞性肺疾病(Chronic Obstructive Pulmonary Disease,COPD)的研究和治疗具有重要意义,为该领域在数字健康技术和人工智能算法应用方面提供了全面且深入的见解,有望推动 COPD 管理模式的变革与发展。
研究背景
COPD 是全球范围内严峻的公共健康问题,它是全球第三大死因,在健康风险因素中排名第七。2019 年,全球约有 3.92 亿人受 COPD 影响,每年导致超过 300 万人死亡。COPD 病情复杂,具有进行性和不可逆的恶化特征,因此早期诊断、及时发现病情恶化和持续监测对于有效管理疾病至关重要。
数字健康技术(Digital Health Technologies,DHTs)借助数字、移动和无线技术,推动健康目标的实现,其涵盖电子健康(e-health)、移动健康(mHealth)、医疗设备远程监测等多个方面。在 COPD 护理中,DHTs 正从传统的自我管理策略向数据驱动的动态方法转变,比如能发送提醒和健康促进信息,促进个性化沟通,提升健康信息的获取。但这些技术产生的大量复杂数据,在分析上颇具挑战,需要先进的计算工具来深入探究 COPD 的进展。
人工智能(Artificial Intelligence,AI)算法,尤其是机器学习(Machine Learning,ML)和深度学习(Deep Learning,DL),在医疗健康领域发挥着越来越重要的作用。它们能够识别医疗数据中的关键模式,助力智能临床系统的构建,提升复杂疾病的诊疗水平。研究表明,AI 有助于慢性病管理和诊断能力的提升。ML 运用统计和数学模型识别数据模式,在诊断中的应用成果显著;DL 则能直接从原始数据中学习,无需手动特征工程,处理非结构化数据的能力突出,在 COPD 检测等方面展现出独特优势。然而,目前缺乏对 DHTs 和 AI 算法在 COPD 领域应用的全面综述,已有文献要么对 AI 在医疗领域的应用泛泛而谈,要么仅聚焦于 COPD 护理中的特定任务。本研究旨在填补这一空白,系统探究 DHTs 和 AI 算法在 COPD 中的主要应用。
研究方法
本次研究严格遵循 PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses)指南进行。研究人员在 2024 年 12 月通过 Web of Science 和 PubMed 数据库进行文献检索,旨在收集借助数字健康平台将 AI 融入 COPD 护理的相关研究。检索时使用了一系列涵盖 AI 在 COPD 相关数字健康领域各方面的关键词(如 “COPD”“artificial intelligence”“Digital health” 等),并结合 “OR” 和 “AND” 逻辑运算符,在文章主题、标题、摘要和全文中进行精确检索,各数据库的具体检索字符串在补充材料 2 中提供。
研究设定了明确的纳入标准:文章需为英文全文,聚焦于 DHTs 和 AI 算法在 COPD 背景下的数据获取和处理的直接应用;必须利用 DHTs 用于 COPD 的实际护理,涉及疾病的诊断、预后、管理或治疗等方面,而非仅仅描述 DHTs 的潜在机制或开发过程;仅纳入原创性研究,排除综述文章、社论和非原创研究论文。首要排除标准是去除两个数据库中的重复记录。
检索最初获得 224 篇文章,去重后剩余 152 篇。由两名独立的评审人员分两个阶段对这些文章进行筛选。第一阶段评估文章的标题和摘要的相关性,筛选出 51 篇符合标准的文章;第二阶段对这 51 篇文章进行全文评审,最终确定 32 项研究符合所有资格标准。在筛选过程中,若两名评审人员存在分歧,则通过达成共识来解决。为确保文献的全面性和时效性,研究人员还进行了补充检索,涵盖 2024 年 3 月 7 日至 2024 年 12 月 24 日期间的文献,又纳入了 9 篇文章,整个筛选过程严格按照 PRISMA 指南进行,并以流程图(Fig. 1)的形式清晰呈现。
数据提取工作围绕四个主要领域展开:一是出版物详细信息,如第一作者和出版年份;二是研究数据,包括参与者数量和特征、数字健康设备捕获的数据类型以及公共数据库的使用情况;三是算法,涉及所使用的 AI 算法类型、具体实施的模型、性能指标及其在 COPD 数字健康中的应用;四是 DHTs 的应用,即部署的 DHTs 及其在 COPD 护理中的作用。数据提取工作由两名独立评审人员完成,若出现差异,则通过讨论解决。之后,研究人员根据 COPD 管理的生命周期阶段对提取的数据进行分析,以确定 AI 算法在 COPD 数字健康管理中的关键进展,并深入了解这些技术如何融入 COPD 护理的各个环节。
研究结果
- COPD 数字健康的数据类型和来源:DHTs 能从 COPD 患者不同环境(家庭、医院、工作场所、户外等)收集多种数据,研究人员将其分为临床数据、患者报告结果和环境与生活方式数据三类。
- 临床数据:这类数据反映患者健康状况,包括临床记录、生命体征(如血氧饱和度 SpO2、心率、呼吸频率)和医学检查结果等。肺功能测试是 COPD 诊断的金标准,便携式 spirometers(肺功能仪)可测量第一秒用力呼气量 FEV1、用力肺活量 FVC 等关键生理指标。此外,智能口罩、电子听诊器、传感器等设备用于跟踪呼吸音,还有研究探索了通过特定传感器获取的二氧化碳信号和光电容积脉搏波信号(PPGs)的图像数据,以及唾液和痰液检查数据,这些都丰富了临床数据的范畴。
- 患者报告结果:主要记录患者的症状,如呼吸急促、咳嗽、发烧、胸痛等,对评估 COPD 严重程度和制定治疗策略至关重要。该类别还包括患者人口统计学信息和病史,通常存储在电子病历中。数字平台,如电子问卷和专门应用程序(如 myCOPD、Re - Admit、DmD),方便患者在家记录和沟通症状,数字笔和日常日记也为患者提供了多样化的数据记录方式。
- 环境和生活方式因素:空气质量、温度、吸烟状况、睡眠模式和体育活动等环境和生活方式因素对 COPD 患者的肺部健康和呼吸功能影响显著。环境传感器和天气数据接口可测量空气质量,如空气质量传感设备、World Air Quality Index(WAQI)数据平台、Weatherbit 应用程序编程接口(API)和 OpenWeather API 等。可穿戴设备和加速度计则用于捕获生活方式相关数据,如 Fitbit、Garmin 等品牌的可穿戴设备,以及 Stayhealthy、ActiGraph GT3X 等加速度计,还有用于评估自然步行速度和距离的移动应用程序,方便进行标准化测试。此外,公共数据库中收集的音频数据(如咳嗽和呼吸声)也扩充了 COPD 研究和分析的数据范围。
- COPD 数字健康中使用的 AI 算法总结:对纳入研究的深入分析显示,应用于 COPD 数字健康的 AI 算法主要包括传统 ML 算法和 DL 算法。在 41 项研究中,34 项使用了传统 ML 算法,16 项采用了 DL 算法。
- ML 算法:在 COPD 数字健康分析中,ML 算法占据核心地位。最常用的五种算法分别是支持向量机(Support Vector Machine,SVM)、Boosting、随机森林(Random Forest,RF)、逻辑回归(Logistic Regression,LR)和决策树(Decision Tree,DT),在 41 项研究中的应用次数分别为 14、14、13、11 和 9 次。SVM 应用广泛,可处理分类和回归任务,能支持多种内核函数,在分析呼吸音等多种数据类型时表现出色,尤其在小数据集上泛化能力强。Boosting 算法将多个弱模型组合成一个强模型,常用于分析复杂的生理和临床数据,如 XGBoost 在处理多种数据组合时性能强劲,CatBoost 在处理医疗记录中的分类数据方面表现优异。基于树的算法(RF 和 DT)抗过拟合能力强,能处理大型数据集,RF 在处理噪声数据(如 COPD 患者的咳嗽声)时效果显著,DT 则便于特征选择和预测。LR 因简单易解释,在预测 COPD 存在方面应用广泛,还能有效处理时间序列数据和识别疾病模式。此外,一些半监督学习算法,如贝叶斯网络和朴素贝叶斯(Na?ve Bayes,NB),也用于 COPD 数字健康研究,帮助管理不确定性和预测病情恶化。
- DL 算法:随着数字健康数据的增长,DL 算法在 COPD 管理中的应用日益广泛。卷积神经网络(Convolutional Neural Network,CNN)、深度神经网络(Deep Neural Network,DNN)、循环神经网络(Recurrent Neural Network,RNN)、长短期记忆网络(Long Short-Term Memory,LSTM)和门控循环单元(Gated Recurrent Unit,GRU)等技术,因其处理复杂多样数据的能力而被频繁使用。CNN 在 41 项研究中有 10 项应用,在图像分类方面表现卓越,可直接捕获空间特征,用于远程监测 COPD 患者的身体活动和健康状况。LSTM(6 项研究应用)和 RNN(5 项研究应用)擅长处理序列数据,如呼吸音和时间序列健康监测数据,在呼吸音检测和分类、远程健康监测等任务中效果良好。一些研究还整合多种 DL 算法应对特定数据挑战,如 Spatio - Temporal Artificial Intelligence Network(STAIN)集成了 CNN 和 RNN,能从时空角度综合分析 COPD 患者数据,还有研究探索了非主流 DL 算法,丰富了研究方法。
- 基于 AI 的数字健康在 COPD 中的应用:AI 算法与数字健康的融合推动了 COPD 领域的发展,通过对 32 项研究的分析,发现 AI 应用主要集中在三个关键领域。
- COPD 筛查和诊断:研究人员采用了不同层次的算法策略进行 COPD 诊断。从应用单一 ML 算法,到整合多种 ML 算法,再到引入 DL 算法,以及开展 ML 和 DL 算法的对比研究,这些都不断提升了诊断的准确性和效率。例如,Zhang 等人开发的集成自供电呼吸传感器和便携式读出电路的智能口罩,结合袋装 DT 模型,区分健康个体和慢性呼吸系统疾病(包括 COPD)患者的准确率高达 95.5%。还有研究利用多种 ML 算法分析脉搏血氧仪数据,XGBoost 在识别 COPD 患者时表现最佳,准确率达 91.04%。DL 算法在 COPD 检测中也发挥了重要作用,如基于 1 - D 可变形 CNN 的系统对二氧化碳传感器分析的分类准确率在实验室和现实环境中分别达到 92.9% 和 92.16%。对比研究发现,CNN 在识别严重 COPD 病例时准确率可达 100%,结合 CNN 和 LSTM 的 ConvLSTM 模型将诊断准确率提升至 97%。综合来看,这些算法诊断 COPD 的中位数准确率为 91.25%,显示出 AI 驱动的诊断工具在未来早期检测和筛查 COPD 方面的巨大潜力。
- 识别和应对 COPD 急性加重:COPD 急性加重会导致肺功能下降、生活质量降低和死亡风险增加,早期检测和及时干预至关重要。大量研究(22/41)聚焦于此,采用了多种 AI 方法。部分研究使用单一 ML 算法,如 DTs、k - means 聚类、贝叶斯网络和 LR 等,其中一项使用 DTs 的研究通过分析呼吸音频数据,成功预测了 16 名 COPD 患者中 11/18 的小波特征,提前 4.4 天检测到急性加重,准确率达 78%。还有研究运用更先进的 AI 方法,如分析加速度计数据监测患者身体活动,通过对数回归、SVM 和神经网络进行分析,SVM 能从 90 个特征中筛选出 17 个相关特征,提高了对 58 名 COPD 患者的评估准确性。交互式数字健康技术也在不断发展,如 Smart Clinical Decision Support System(CIDSS)利用 LSTM、GRU 和 Boosting 算法评估 COPD 急性加重风险,EDGE 系统分析脉搏血氧仪数据,发现氧饱和度、呼吸频率和脉搏率是急性加重事件的关键预测指标,结合 ML 算法显著提高了预测准确性,证明了脉搏血氧仪在家中监测的可靠性。
- COPD 患者监测:持续监测对 COPD 患者至关重要,DHTs 可监测多种实时参数,如步态、步行速度、姿势、呼吸频率、血氧水平、心率和血压等,多种 AI 算法用于提高监测的准确性和效率。Juen 等人利用智能手机传感器收集步行数据,使用 SVM 等 ML 算法预测患者步行速度和距离,在受控的 6 分钟步行测试中预测准确率高,误差率仅 3.23%,显示出在自然步行条件下的应用潜力。Sanchez - Morillo 等人开发的智能便携式制氧机(iPOC)能根据患者身体活动水平自动调节氧气流量,初步试验中加权准确率达 91.1%,相比传统制氧机,能更好地满足患者氧合需求,提高患者满意度。此外,AI 算法还用于监测 COPD 患者的言语模式,通过 ML 分类技术可成功预测肺功能(FEV1),强调了记录患者病情和用药信息对开发自动化监测系统的重要性。还有研究提出将环境传感器、肺功能仪和峰值流量计与概率潜在成分分析(Probabilistic Latent Component Analysis,PLCA)和线性动态系统(Linear Dynamical Systems,LDS)等算法相结合的框架,用于多变量跟踪和预测,能在病情稳定期检测呼吸症状变化,提供更全面的监测方法。
研究结论与讨论
本研究系统回顾了 AI 算法在 COPD 数字健康中的应用,发现 ML 和 DL 算法在推进数字健康、改善 COPD 护理方面发挥了重要作用,尤其在筛查和诊断、急性加重预测和患者监测等领域。然而,目前的研究仍面临一些挑战。
在 DHTs 数据获取方面,数据多模态且高维,临床和患者报告数据应用广泛,但环境和生活方式数据利用不足,尽管其能提高预测准确性,但采集和分析难度较大。此外,数据共享存在障碍,特别是跨越国家和机构边界时,需要加强全球合作,建立全面的 COPD 数据集,以提升监测系统的准确性,深化对疾病流行病学的理解,并制定更精准个性化的治疗策略。
对比 ML 和 DL 算法,ML 算法在 COPD 数字健康应用中占主导地位,SVM 和 Boosting 算法使用频率较高。DL 算法应用逐渐增多,在处理大型多样数据集时表现出优势,但许多研究样本量小,限制了 DL 模型的应用,易导致过拟合且难以推广。同时,DL 算法缺乏可解释性,阻碍了其在临床实践中的应用,虽已有一些解决方法,但仍需进一步研究提高其透明度和可解释性。
从实际应用角度看,AI 驱动的 DHTs 在 COPD 急性加重预测方面研究最多,因其对患者预后和医疗系统负担影响重大。然而,要确保所有 COPD 患者公平受益,需解决技术获取的不平等问题,考虑人口差异设计 AI 算法,同时降低成本,开发易用的数字工具,特别是针对资源有限地区和技术能力有限的患者。
本研究也存在局限性,如检索策略可能遗漏关注特定或新颖 AI 技术的研究,文献检索仅局限于 PubMed 和 Web of Science 数据库,且纳入研究多为小规模试验,影响研究结果的普遍性。
未来研究可从多方面展开。一是探索先进技术,如迁移学习和基于预训练模型(如 GPT - 4)的应用,提高 AI 在 COPD 管理中的适应性和精准度。二是着力提高 AI 模型的可解释性,增强医疗专业人员对 AI 生成结果的信任,促进其融入临床工作流程。三是重视技术公平性和可及性问题,优化多传感器融合技术,开发高精度的可穿戴设备和移动应用程序,确保不同背景的 COPD 患者都能从 DHTs 中受益,减少健康差距。通过解决这些问题,AI 驱动的 DHTs 有望更有效地满足 COPD 患者的多样化需求,改善患者的长期预后。