利用基于视频的脉搏血氧饱和度(PPG)技术和深度学习来估算血压
《Image and Vision Computing》:Estimating blood pressure using video-based PPG and deep learning
【字体:
大
中
小
】
时间:2025年08月26日
来源:Image and Vision Computing 4.2
编辑推荐:
通过视频面部采集的rPPG信号处理和深度学习方法,提出三阶段非侵入式血压估算管道,包含信号提取、去噪转换和血压计算,并构建新数据集验证其有效性,平均误差分别为9.2±11.3mmHg(收缩压)和8.6±9.1mmHg(舒张压)。
这篇论文介绍了一种全新的方法,用于通过远程视频采集的面部血流变化信号,估计收缩压和舒张压。该方法的核心在于构建一个包含三个主要阶段的流程:从视频中提取rPPG信号、对rPPG信号进行降噪处理以生成类似PPG的波形,以及基于该波形进行血压估计。这一流程的设计旨在解决当前缺乏同时包含视频、rPPG信号和血压数据的完整数据集的问题,从而提升远程血压监测的可行性与准确性。
传统的血压测量方法依赖于血压计,这些设备通常需要与被测者直接接触,可能带来不适感。然而,随着技术的进步,非接触式的视频监测方法逐渐成为一种新的选择,特别是在智能健康环境(AAL)中,这种无侵入性、无接触的监测方式能够实现更便捷和持续的健康数据收集。视频光体积描记法(video-based PPG)作为一种光学技术,能够通过分析皮肤下的血流变化,为血压估计提供了一种新的可能性。在这一领域,远程视频光体积描记法(rPPG)的概念进一步拓展了其应用范围,使得普通摄像头和传感器可以成为心血管健康监测的工具。
rPPG信号的提取是整个流程的第一步,它涉及从视频帧中识别与心脏跳动相关的血流变化。为了提高信号质量,视频采集前通常会进行预处理,以消除运动伪影和光照变化的影响。通过这一阶段,研究团队能够获得更清晰、更稳定的rPPG信号,为后续的降噪和血压估计奠定基础。然而,rPPG信号往往受到多种噪声源的干扰,如环境光、面部表情、运动等,因此需要进行降噪处理以提升其与传统PPG信号的相似性。
在第二阶段,研究团队采用先进的算法对rPPG信号进行降噪处理,并将其转换为类似PPG的波形。这一过程不仅能够增强信号的清晰度,还能使信号更接近传统PPG信号的形态,从而为后续的血压预测提供更可靠的数据基础。通过比较不同降噪方法的效果,研究团队发现某些方法在提升信号质量方面表现更为突出,能够显著改善其与PPG信号的匹配程度。这一阶段的成功对于整个流程至关重要,因为它直接影响了后续血压估计的准确性。
第三阶段是基于转换后的PPG-like信号进行收缩压和舒张压的估计。这一阶段利用了已有的PPG数据模型,这些模型通常已经经过训练,并且能够准确预测血压值。通过将rPPG信号转换为类似PPG的波形,研究团队可以复用这些已有的模型,从而避免从头开始训练新的网络,提高效率。实验结果显示,该方法能够有效提取血压信息,其收缩压和舒张压的平均误差分别为9.2 ± 11.3 mmHg和8.6 ± 9.1 mmHg,这表明其在实际应用中的可行性。此外,降噪后的rPPG信号与传统PPG信号之间的高度相关性进一步支持了这一转换过程的有效性。
为了验证该流程的性能,研究团队在每个阶段都进行了与现有技术的比较分析,并通过实验室环境下的受控实验收集了一组专门的数据集。这些数据集包括同步的视频记录、rPPG信号、PPG信号以及对应的血压测量值,为后续的模型训练和评估提供了坚实的基础。通过这些实验,研究团队不仅能够评估各个阶段算法的性能,还能为最终的血压预测模型提供准确的训练数据。
在方法的构建过程中,研究团队还考虑了多种因素,包括数据集的构建、算法的选择和模型的训练。他们发现,尽管存在一些包含PPG信号和血压测量值的数据集,但缺乏同时包含视频和rPPG信号的数据集,这限制了远程血压监测的发展。因此,他们通过构建一个同步数据集,解决了这一问题,并为后续的模型训练提供了新的可能性。此外,他们还对不同rPPG信号提取算法进行了比较,评估了其在不同场景下的性能表现,为选择最优的算法提供了依据。
在降噪阶段,研究团队尝试了两种不同的方法,以提升rPPG信号的质量。这些方法包括基于滤波器的降噪和基于深度学习的降噪。通过实验对比,他们发现其中一种方法在提升信号与PPG信号的匹配度方面表现更为突出,能够显著改善信号的稳定性。这一阶段的成功不仅提高了后续血压预测的准确性,还为整个流程的可靠性提供了保障。
在血压预测阶段,研究团队利用了已有的PPG数据模型,这些模型通常已经经过训练,并且能够准确预测血压值。通过将rPPG信号转换为类似PPG的波形,他们能够复用这些模型,从而避免从头开始训练新的网络,提高效率。实验结果显示,该方法能够有效提取血压信息,其收缩压和舒张压的平均误差分别为9.2 ± 11.3 mmHg和8.6 ± 9.1 mmHg,这表明其在实际应用中的可行性。此外,降噪后的rPPG信号与传统PPG信号之间的高度相关性进一步支持了这一转换过程的有效性。
该研究的主要贡献在于设计了一个全新的、具有广泛适用性的三阶段流程,用于从面部视频中估计收缩压和舒张压。这一流程不仅能够解决当前数据集不足的问题,还能提升远程血压监测的准确性和可靠性。此外,研究团队还对不同rPPG信号提取算法进行了比较分析,评估了两种降噪方法的效果,并对基于PPG-like信号的神经网络模型进行了基准测试。这些工作为未来的研究提供了新的方向,并为实际应用中的血压监测提供了可行的解决方案。
为了确保研究的全面性,论文还详细描述了实验设置和结果分析。研究团队在每个阶段都进行了系统的比较,以评估所选算法与现有技术的性能差异。通过这些实验,他们能够提供充分的证据,证明所选模型在实际应用中的有效性。此外,研究团队还强调了该方法在非接触式、无侵入性血压监测中的潜力,特别是在智能健康环境中,这种持续、隐蔽的监测方式能够为健康管理提供重要支持。
在讨论部分,研究团队指出,虽然已有研究尝试利用PPG信号进行血压估计,但大多数研究仍然局限于传统的接触式设备。相比之下,该研究提出的基于视频的rPPG方法能够实现非接触式的血压监测,这在某些应用场景中具有显著优势。然而,该方法仍然存在一定的局限性,例如在不同光照条件下信号质量可能受到影响,以及在不同个体之间的信号变化可能较大,这需要进一步的研究和优化。
在结论部分,研究团队总结了该方法的优势和潜在应用价值。他们指出,该方法不仅能够有效提取血压信息,还能在非接触式、无侵入性的前提下实现持续的健康监测。此外,他们还强调了该方法在智能健康环境中的重要性,特别是在需要长期监测和隐蔽监测的场景中,如家庭健康监测、远程医疗等。研究团队认为,该方法的提出为未来的研究提供了新的方向,并为实际应用中的血压监测提供了可行的解决方案。
在作者贡献部分,研究团队详细描述了每位作者在项目中的具体工作。Gianluca Zaza负责撰写和编辑论文、验证方法、监督项目、管理数据、进行研究和数据整理,以及提出概念。Gabriella Casalino负责撰写和编辑论文、监督项目和提出方法。Sergio Caputo负责可视化、软件开发、方法研究、实验分析和数据整理。Giovanna Castellano负责撰写和编辑论文、验证方法、监督项目和提出方法。这些贡献表明,研究团队在该项目中发挥了重要作用,涵盖了从数据采集到模型训练和结果分析的各个环节。
在声明部分,研究团队提到他们在撰写过程中使用了GPT-4o和Grammarly进行语言编辑,但随后进行了必要的审核和修改,确保论文内容的准确性和完整性。此外,研究团队还声明了该研究未获得任何特定资助,并且不存在可能影响研究结果的财务利益或个人关系。这些声明进一步证明了研究的独立性和可靠性。
最后,研究团队对项目提供了感谢,特别感谢了PNRR项目FAIR - Future AI Research(PE00000013),Spoke 6 - Symbiotic AI(CUP H97G22000210007)的支持,以及NextGenerationEU的资助。此外,他们还提到Ga.C、G.C和G.Z是INdAM GNCS研究小组的成员,而Ga.C和G.C是Bari Aldo Moro大学的CITEL - Centro Interdipartimentale di Telemedicina中心的研究人员。这些信息表明,该研究得到了学术界和相关机构的支持,为未来的研究提供了良好的基础。
综上所述,这篇论文提出了一种全新的方法,用于通过远程视频采集的面部血流变化信号,估计收缩压和舒张压。该方法的核心在于构建一个包含三个主要阶段的流程,即rPPG信号提取、降噪处理和血压估计。通过解决当前数据集不足的问题,研究团队不仅提升了远程血压监测的准确性,还为实际应用中的健康监测提供了新的可能性。此外,该方法在非接触式、无侵入性的前提下,能够实现持续的健康监测,具有广泛的应用前景。研究团队的贡献涵盖了从数据采集到模型训练和结果分析的各个环节,为未来的研究提供了重要的参考。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号