CardioPPG:基于PPG-ECG跨模态对比学习的心血管疾病早期筛查新框架
《npj Digital Medicine》:AI modeling photoplethysmography to electrocardiography useful for predicting cardiovascular disease
【字体:
大
中
小
】
时间:2025年12月15日
来源:npj Digital Medicine 15.1
编辑推荐:
本研究针对光电容积脉搏波(PPG)在心血管疾病(CVD)筛查中易受噪声干扰且缺乏直接电生理标记的局限性,提出了一种名为CardioPPG的跨模态学习框架。通过对比学习将PPG与心电图(ECG)特征在共享潜在空间中对齐,并结合自回归生成模型合成高质量ECG信号。实验表明,CardioPPG在10类CVD筛查中显著优于PPG基线模型(如对二尖瓣/主动脉瓣疾病、心房颤动(AF)的AUC提升达41.3%和12.2%),并在外部AF数据集中达到99.5%的AUC,证实其泛化能力。该研究为家庭场景下低成本、非侵入性心血管监测提供了可解释的AI解决方案。
心血管疾病(CVD)是全球死亡的首要原因,早期检测对改善患者预后至关重要。然而,传统心电图(ECG)检查依赖专业设备与人员,难以在家庭环境中普及。光电容积脉搏波(PPG)作为消费级穿戴设备中广泛使用的非侵入性技术,虽具便携优势,却因信号易受噪声干扰且缺乏直接电生理信息,其在心律失常、缺血性心脏病等关键CVD诊断中的准确性受限。这一矛盾凸显了通过融合ECG的判别性特征以增强PPG筛查能力的迫切需求。
为此,浙江大学团队在《npj Digital Medicine》发表研究,提出CardioPPG——一种创新的跨模态学习框架。该框架通过对比学习将PPG与ECG信号在潜在空间中对齐,使PPG能够捕获ECG的关键表征,并利用自回归模型生成高保真ECG波形以提升结果可解释性。研究旨在解决PPG在家庭环境中筛查CVD的可靠性问题,为资源有限场景下的早期干预提供新思路。
研究基于PulseDB(含MIMIC-III、VitalDB)和MESA数据集,对超过890万段PPG-ECG配对信号进行预处理与质量过滤。技术核心包括:(1)采用掩码自编码器(MAE)对PPG和ECG分别进行自监督预训练;(2)通过对比学习损失函数实现双模态特征空间对齐;(3)设计基于短时傅里叶变换(STFT)的双分支向量量化变分自编码器(VQ-VAE)与双向Transformer,构建PPG条件引导的ECG生成模型。下游任务使用PulseDB-MIMIC数据集进行10类CVD分类微调,并在外部AF数据集(BBX46智能戒指采集)验证泛化性。
在PulseDB-MIMIC数据集的10类CVD二分类任务中,CardioPPG均显著优于仅使用PPG的自监督基线(SSL-PPG)。例如,对二尖瓣/主动脉瓣疾病(MAVD)的检测AUC达0.852,与ECG基线模型(SSL-ECG)无统计学差异;对心房颤动(AF)的AUC提升至0.966,接近临床ECG诊断水平。尤为突出的是,CardioPPG在心肌病(CM)和阵发性室上性心动过速(PSVT)分类中甚至超越SSL-ECG模型(AUC分别为0.813和0.903)。
在外部AF数据集(86例样本)的双通道PPG测试中,CardioPPG在两个通道的AUC分别达到99.5%和98.6%,显著高于SSL-PPG基线。此外,在非心血管任务(如日常活动数据集PPG-DaLiA和情绪数据集WESAD)中,CardioPPG亦表现稳定,其跨领域适应性挑战了“ECG始终为上限”的传统认知。
当仅使用10%的标注数据微调时,CardioPPG仍优于全量训练的SSL-PPG基线,显示其强大的小样本学习能力。在训练效率方面,CardioPPG平均收敛所需epoch数比SSL-PPG减少约50%,显著降低计算成本。
在正常心律、PSVT、PVT和AF的四分类任务中,CardioPPG对AF的检测AUC达0.987,远高于SSL-PPG(0.778),且接近SSL-ECG(0.993)。混淆矩阵显示其多类判别能力均衡,印证了跨模态对齐对细粒度心律失常筛查的增强作用。
CardioPPG在ECG合成任务中全面优于RDDM、WGAN等基线方法。其生成的ECG在分布指标(如Fréchet距离、自相关差异)上更接近真实信号,t-SNE可视化显示生成与真实ECG几乎完全重叠。定性案例进一步验证了其对QRS波群、ST段等关键形态的保真度。
CardioPPG通过跨模态对比学习与生成建模的协同,实现了PPG信号对ECG临床信息的有效捕获,为家庭环境下心血管疾病的早期、连续监测提供了新范式。其核心优势在于:①突破PPG的生理信息局限,在多项CVD筛查中达到或超越ECG性能;②生成的可视化ECG波形增强模型可解释性,辅助临床决策;③高效的数据利用能力降低对标注资源的依赖。研究局限性包括训练数据地理代表性不足、生成机制与疾病形态关联尚不明确等。未来需通过多中心前瞻性研究验证临床适用性,并探索环境噪声、肤色差异等现实因素的影响。该框架的弱监督跨模态迁移范式有望拓展至其他不对称模态配对(如影像注释与传感器数据),推动多模态医疗AI的发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号