用于从BCG信号中检测非接触式心房颤动的CNN-Transformer模型
《Biomedical Signal Processing and Control》:CNN-Transformer model for non-contact AF detection from BCG signals
【字体:
大
中
小
】
时间:2025年11月25日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
房颤(AF)非接触式检测方法,基于BCG信号的多尺度残差Transformer网络MSRTNet,通过四类分类框架处理噪声信号,在30秒窗口达到97.6%准确率,支持5/10/15/30秒变长输入,适用于家庭长期监测。
在现代医疗技术不断发展的背景下,心律失常的检测与监控已经成为提升心血管疾病管理效率的重要手段。其中,心房颤动(Atrial Fibrillation,简称AF)作为一种常见的慢性心律失常,对全球数亿人的健康构成威胁。据估计,目前约有3300万人受到AF的影响,预计未来几十年这一数字将翻倍。因此,开发一种高效、准确且便于应用的AF检测方法,对于改善患者的生活质量、降低医疗成本以及推动远程医疗的发展具有重要意义。
传统的AF检测方法主要依赖于心电图(ECG)技术,该技术通过电极直接接触皮肤来捕捉心脏电活动的变化。虽然ECG在临床诊断中具有较高的准确性和可靠性,但其应用受到设备接触性、专业人员操作和长期监测不便等因素的限制。为了克服这些局限,研究人员开始探索非接触式的心脏信号采集方式,其中球体心图(Ballistocardiogram,简称BCG)作为一种新兴的无创监测技术,展现出巨大的应用潜力。BCG信号通过测量人体在心脏跳动时产生的微小机械振动来反映心脏活动,这种方法不仅避免了皮肤接触的不适,还能够实现长时间、连续的监测,非常适合家庭或远程医疗环境。
然而,BCG信号的采集与处理面临诸多挑战。首先,BCG信号的波形特征相较于ECG更为复杂和多变,受到个体差异、测量环境和运动干扰等因素的影响较大。其次,传统的手动特征提取方法难以适应这种信号的非平稳性和多样性,导致在实际应用中出现特征识别不准确、模型泛化能力不足等问题。此外,BCG信号中常混杂着噪声,这些噪声可能来自于外部环境干扰、设备本身的不稳定性以及患者的自主运动,进一步增加了信号处理的难度。
为了解决这些问题,近年来深度学习技术在BCG信号分析中展现出显著的优势。卷积神经网络(Convolutional Neural Networks,简称CNN)因其在图像识别和信号处理方面的强大能力,成为自动特征提取的重要工具。然而,单独使用CNN模型在处理BCG信号时仍存在一定的局限性。例如,CNN主要关注局部空间特征,对于信号中的长程时间依赖性建模能力较弱,而AF的诊断往往需要对信号的整体动态变化进行综合分析。因此,为了更全面地捕捉BCG信号中的关键信息,研究者开始尝试将CNN与其他能够处理长距离依赖性的模型相结合,如Transformer架构。
在这一背景下,本研究提出了一种基于非接触式BCG信号的AF检测方法,其核心是一种多尺度残差Transformer网络(Multi-Scale Residual Transformer Network,简称MSRTNet)。该模型通过整合多尺度残差卷积神经网络与优化的Transformer编码器,实现了对BCG信号中局部和全局特征的同步提取。多尺度残差卷积网络能够从不同时间分辨率下提取BCG信号的局部特征,而优化的Transformer编码器则通过自注意力机制捕捉信号中的长程依赖关系。这种结合不仅提升了模型的特征表达能力,还增强了其在复杂信号环境下的鲁棒性。
为了进一步提高模型在实际应用中的性能,本研究还引入了一种噪声感知门控(Noise-Aware Gating,简称NAG)机制。该机制通过动态估计时间域中的噪声水平,生成相应的门控权重矩阵,从而有效抑制噪声对注意力计算的干扰。这使得模型能够更专注于高质量的生理信号区域,提升对关键特征的识别能力。此外,研究还采用了可微分的相对位置编码机制,通过建模IJK波段之间的相对时间关系,增强了模型对关键波形特征的时间依赖性建模能力。
在数据处理方面,本研究对BCG信号进行了系统性的预处理,包括使用巴特沃斯带通滤波器进行频率带选择、采用均方根(RMS)平滑技术减少信号噪声,并将原始信号分割为多个非重叠的30秒窗口。为了评估模型在不同长度输入信号下的表现,这些30秒窗口又被进一步细分为5秒、10秒和15秒的子段。这种数据处理策略不仅为模型提供了丰富的训练样本,还确保了其在实际应用中能够适应不同长度的信号输入,提高了模型的适用性和灵活性。
实验结果显示,MSRTNet在基于30秒窗口的四分类框架下,取得了高达97.6%的整体准确率和95.7%的AF检测灵敏度。这一成绩显著优于传统的手动特征提取方法,也优于单一CNN模型的性能。特别是在处理非平稳信号和运动伪影方面,MSRTNet表现出更强的鲁棒性和适应性。此外,模型还支持不同长度的BCG输入,使得其在临床标准AF检测和早期预警方面均具有良好的应用前景。
本研究的主要贡献体现在三个方面。首先,通过将多尺度残差卷积网络与优化的Transformer模块相结合,提出了一种端到端的深度学习方法,能够直接从原始BCG信号中学习到关键特征,避免了传统方法中依赖手动特征提取的步骤,从而提高了模型的自动化程度和计算效率。其次,引入了NAG机制和可微分的相对位置编码机制,有效提升了模型对噪声和运动伪影的抑制能力,增强了其在实际监测环境中的稳定性。最后,模型支持多种长度的输入信号,采用四分类框架,使得其能够更好地适应真实世界的监测需求,为长期的家庭监测和远程医疗提供了新的解决方案。
此外,本研究的实验平台基于Python 3.10和PyTorch 2.0框架搭建,利用其灵活的动态计算图、易于构建和调试的模型结构以及对GPU加速的良好支持,实现了对复杂模型结构(如多头注意力机制和噪声感知门控)的高效处理。实验环境配置为Windows 11系统,并配备了高性能计算资源,以确保模型训练和评估的稳定性和效率。
在讨论部分,研究指出MSRTNet模型在AF检测中的优异表现,特别是在非接触式监测方面。与传统的ECG方法相比,该模型无需直接接触皮肤,适用于老年人和无法频繁前往医院的患者,为家庭护理和远程医疗提供了便捷的解决方案。同时,模型能够有效处理BCG信号中的运动伪影和信号波动,使其在真实世界环境中具有更强的适应性和可靠性。
研究的结论表明,本提出的CNN-Transformer混合模型在BCG信号分类任务中表现出色,特别是在处理AF、窦性心律(SR)、运动伪影(MA)以及其他噪声信号的四分类任务中。通过实验验证,该模型在不同长度的信号输入下均能保持较高的检测准确率和灵敏度,展示了其在实际应用中的广泛适用性。此外,该模型的结构设计使得其在处理复杂信号时具备更高的灵活性和泛化能力,为未来的智能医疗设备开发提供了新的思路和技术支持。
综上所述,本研究提出了一种基于非接触式BCG信号的AF检测方法,通过结合多尺度残差卷积网络和优化的Transformer编码器,实现了对BCG信号中局部和全局特征的同步提取。同时,引入的噪声感知门控机制和可微分的相对位置编码机制显著提升了模型在噪声环境下的性能。实验结果表明,该模型在四分类任务中取得了优异的检测效果,为长期的家庭监测和远程医疗提供了有力的技术支持。未来,随着BCG信号采集技术的进一步成熟和深度学习模型的持续优化,这种非接触式、自动化的AF检测方法有望在更广泛的医疗场景中得到应用,为提升心血管疾病管理效率和患者生活质量做出更大的贡献。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号