利用光电容积描记(PPG)信号及其衍生数据,实现可解释的机器学习方法用于高血压检测

《Biomedical Signal Processing and Control》:Interpretable machine learning for hypertension detection using photoplethysmography (PPG) signals and their derivatives

【字体: 时间:2025年11月20日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  本研究开发并评估了一种新型机器学习方法,用于通过光电容积描记(PPG)信号及其导出信号(速度PPG和加速度PPG)预测高血压和估计血压值。整合临床数据与APG信号后,经多数投票和特征筛选优化,模型AUC达到0.810,并通过SHAP分析解释特征影响。该研究为PPG信号在高血压监测中的应用提供了新基准。

  
宋敏秀|李承博
韩国大邱庆明大学医学院医学信息学系

摘要

高血压是包括糖尿病在内的心血管疾病的主要风险因素,需要持续监测才能有效管理。本研究开发并评估了一种新的机器学习方法,利用光电容积描记(PPG)信号及其导数来检测高血压和估计血压(BP)。分析了一个包含219名个体的数据集,将临床数据与PPG波形及其导数(速度VPG和加速度APG)相结合。从分割的脉搏单元中提取特征,并通过网格搜索和k折交叉验证评估了多种机器学习(ML)模型。应用多数投票算法来增强模型的鲁棒性。分类提升(Categorical Boosting)表现出优越的性能,在所有特征上的平均曲线下面积(AUC)达到了0.704。结合临床特征和APG后,通过多数投票算法得到的性能最高(AUC = 0.801)。特征选择识别出关键因素,包括年龄、体重指数、心率和特定信号特征,进一步将模型性能提升至AUC = 0.810。Shapley加性解释(Shapley Additive Explanations,SHAP)分析阐明了特征对模型预测的影响。本研究为使用PPG信号预测高血压建立了新的基准,提供了一个鲁棒且可解释的模型,支持临床实践中的持续监测和及时干预。未来的研究应扩大样本多样性并进行前瞻性验证,以提高模型的泛化能力。

引言

高血压,或称血压升高,是一种常见的心血管疾病,其特征是动脉压力持续升高,这显著增加了心脏病发作[1]、心力衰竭[2]、糖尿病[3]和中风[4]的风险。根据世界卫生组织(WHO)[5]的数据,全球有超过11亿人患有高血压,其中一半以上生活在低收入国家。尽管存在这些风险,高血压常被称为“沉默的杀手”,因为它在发展到晚期之前不会引起任何特定症状。表1根据收缩压和舒张压测量值对血压值进行了全面分类[6]。

传统上,血压监测依赖于使用血压计的测量方法,这是一种标准方法,涉及一个可充气的袖带。然而,这种传统的基于袖带的方法通常是间歇性的,每次测量之间需要一定的时间间隔,这限制了实时收集连续数据的能力,使得有效管理血压变得困难[7]。
人们越来越关注使用光电容积描记(PPG)信号来预测高血压,作为替代基于袖带的方法以应对这些挑战。PPG是一种非侵入性的光学方法,利用光源和光电探测器测量微血管血容量的变化。光吸收或反射随心动周期变化,从而可以提取出诸如心率变异性和外周体积变化等特征。由于外周体积变化与血压相关,PPG在识别与血压相关的特征方面显示出巨大潜力[8]。
先前的研究已经探讨了使用机器学习(ML)技术分析PPG信号与高血压和血压之间的关系的潜力[[9], [10], [11]]。这些研究表明,利用PPG波形分析开发血压监测系统是可行的,有可能取代基于袖带的方法。然而,现有模型受到临床分析难度和由于特征提取过程不规范而导致性能不佳的限制。此外,缺乏将临床数据与生理信号处理技术相结合来检测高血压或开发血压估计模型的研究。而且,这些模型通常作为黑箱技术运行,因为特征提取过程的标准不明确,这阻碍了它们的可解释性,并限制了它们在医学机器学习中的应用[12]。
本研究旨在通过提出一个集成以下内容的ML框架来解决这些限制:(1)经过临床验证的PPG采集协议;(2)严格的数据预处理和质量控制措施;(3)可解释的ML模型。首先,结合了基于已知心血管生理学的新型特征提取流程,确保相关性和可解释性。其次,将这些生理相关特征与标准临床变量相结合,以增强高血压预测和血压估计模型的鲁棒性。第三,在单脉冲分析中应用多数投票方案以提高分类稳定性,随后通过特征选择过程消除无信息特征并最小化过拟合。最后,通过Shapley加性解释(SHAP)引入了模型可解释性,使得可以将模型决策映射到已建立的临床指标上。

相关研究

在机器学习方法出现之前,就已经有人提出PPG在预测高血压方面的潜力。临床研究使用各种方法分析了PPG及其导数信号VPG和APG,以解释PPG信号与血压之间的相关性[13]。在这些临床研究之后,一些研究人员回顾和评估了利用机器学习技术分析高血压和血压的潜力[14]。这些研究应用了各种机器学习技术,从经典方法开始

数据集

本研究使用了桂林人民医院创建的PPG-BP数据库[23]。该数据库包含219名年龄在21至86岁之间的个体(中位年龄58岁),性别分布为48%男性和52%女性。PPG信号是从左手食指指尖使用SEP9AF-2(SMPLUS公司,韩国)在660纳米(红光)和905纳米(红外)波长下获取的,并在0.5–12赫兹范围内进行过滤。
在3分钟的数据采集阶段,同时测量了血压(BP)和PPG。

每个特征的机器学习性能

表4展示了基于临床特征和信号特征(PPG、VPG和APG)的七种机器学习评估结果。通过网格搜索和10折交叉验证,优化了CatBoost模型,超参数设置为(深度=6,学习率=0.1,迭代次数=100,l2_leaf_reg=5)。表4中的结果显示了各种特征对应的ML分类器的平均AUC值

讨论

本研究在使用PPG信号和ML架构进行高血压预测方面取得了几项关键进展。通过利用全面的ML架构选择和精确选择的特征组合,预测准确性得到了显著提高。通过比较分析,确定了更适合PPG任务的模型和特征组合,从而显著改善了结果。此外,还整合了多数投票策略来进一步提高性能

结论

本研究开发并评估了一种利用PPG信号及其导数预测高血压的新机器学习模型。结合临床数据和APG信号获得了最佳性能,当应用多数投票算法时,AUC达到了0.801。此外,通过特征选择,模型的性能进一步提高,达到了0.810,显著优于现有的高血压预测模型。
本研究提供了比较

CRediT作者贡献声明

宋敏秀:撰写——审稿与编辑,撰写——原始草稿,方法论。李承博:撰写——审稿与编辑,可视化,验证,监督,软件,资源,项目管理,方法论,调查,资金获取,正式分析,数据整理,概念化。

资助

本研究得到了韩国卫生福利部(HI22C0452)的支持。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。

致谢

作者声明他们获得了用于本研究、作者身份和/或文章发表的财务支持。该研究得到了韩国卫生技术研发项目(通过韩国健康产业开发研究所(KHIDI)的资助,该机构由韩国卫生福利部资助(资助编号:HI22C0452)。

科学写作中关于生成式AI的声明

不适用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号