
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于神经网络的心率分类系统中图像压缩效应的评估与分析
【字体: 大 中 小 】 时间:2025年07月03日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对远程心率(HR)监测中视频数据传输带宽大的问题,创新性地评估了图像压缩对神经网络(NN)心率分类系统的影响。研究人员通过DenseNet-121、VGG-16和Inception V3模型测试发现,VGG-16在JPEG压缩条件下仍保持97.2%的准确率,为低带宽环境下的可穿戴医疗设备开发提供了重要技术支撑。
在数字健康时代,心率监测技术正从接触式向非接触式跨越。传统光电体积描记(PPG)和心电图(ECG)传感器虽精度高,但存在佩戴不适、运动干扰等问题。更棘手的是,基于视频分析的远程心率监测需要处理海量数据——段1080p未压缩视频每分钟就占用177MB空间,这对移动设备和远程传输构成巨大挑战。
汉阳大学的研究团队在《Scientific Reports》发表的研究另辟蹊径,将视频心率监测简化为关键帧图像分类问题。通过系统评估JPEG/PNG压缩对神经网络模型的影响,发现即使将图像压缩至原始大小的3.1%(QF=20),VGG-16模型仍能保持89.88%的准确率,这一突破为资源受限场景下的实时心率监测提供了新思路。
研究采用捷克理工大学提供的ECG-Fitness数据集,包含17名受试者在不同光照(自然光/卤素灯/LED)和运动状态(划船/骑行等)下的面部视频。关键技术包括:1)基于SeetaFace2的面部检测与256×256区域裁剪;2)FFmpeg视频帧处理;3)libjpeg-turbo实现多级JPEG压缩;4)DenseNet-121/VGG-16/Inception V3三模型对比评估。
【实验设计】
系统架构分为训练和推理两大模块。训练阶段将PNG格式的面部图像按70:15:15划分为训练/验证/测试集,HR值被离散化为8个区间(每7bpm一档)。推理阶段则测试不同JPEG质量因子(QF10-90)对分类性能的影响。
【模型表现】
VGG-16展现出卓越的鲁棒性:训练准确率99.87%、验证准确率97.21%,显著优于DenseNet-121(验证准确率80.69%)。五折交叉验证进一步证实其稳定性,平均验证准确率达95.72%。
【压缩影响】
测试数据显示,当QF≥50时(压缩比4.5%),所有模型准确率均超90%。值得注意的是,VGG-16在QF=90时达到峰值97.20%,仅比无损条件下降0.01%,证明适度压缩几乎不影响分类性能。
【时间效率】
Inception V3处理速度最快(225帧/秒),而DenseNet-121最慢(106帧/秒),这对实时应用场景的模型选型具有指导意义。
这项研究的重要意义在于:首次量化了图像压缩质量与神经网络心率分类精度的关系,证实VGG-16在压缩环境下仍保持临床级精度(>95%)。其采用的"关键帧分类+局部压缩"策略,相比传统视频流处理可降低97%以上的传输带宽,为智能手机、可穿戴设备等资源受限平台的心率监测提供了实用化解决方案。未来研究可进一步探索HEVC等新型编解码器的影响,并扩大样本多样性以提升模型泛化能力。
生物通微信公众号
知名企业招聘