
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于知识蒸馏与频繁序列模式挖掘的心脏疾病增强诊断模型研究
【字体: 大 中 小 】 时间:2025年09月09日 来源:Knowledge-Based Systems 7.6
编辑推荐:
【编辑推荐】本研究创新性地将知识蒸馏(KD)与频繁序列模式挖掘(PREFIXSPAN)结合,提出Attention-DC教师网络与轻量化DSCNN学生网络协同框架,通过改进水鸟优化算法(ICOA)调参,在心脏病、心血管疾病和糖尿病数据集上实现99.3%+超高准确率,为解决医疗数据高噪声、高维度及计算资源受限问题提供新范式。
亮点
本研究通过知识蒸馏(KD)框架将大型教师网络的知识迁移至轻量化学生网络,显著提升医疗时序数据分析效率。采用基于注意力的密集连接胶囊网络(Attention-DC)作为教师模型,结合深度可分离卷积神经网络(DSCNN)的轻量化优势,在保留时序特征的同时降低83%参数量。改进的水鸟优化算法(ICOA)动态调整超参数,使模型在300训练周期(batch size=32,学习率0.001)下达到最优。
核心方法
数据清洗:采用基于分位数离群值检测的预处理流程,消除电子健康记录(EHR)中不规则的时序噪声
序列挖掘:PREFIXSPAN算法挖掘病程发展中的高频事件链,如"胸痛→ST段抬高→心肌酶升高"的典型心梗序列
蒸馏框架:教师网络(Attention-DC)通过胶囊动态路由机制捕捉症状间空间层级关系,学生网络(DSCNN)采用深度可分离卷积实现参数共享
性能验证
在MIT-BIH心律失常数据集上的对比实验显示:
准确率99.512%(心脏病)vs CNN-LSTM的97.2%
召回率98.7%优于ResNet的95.3%
F1-score 99.1%显著超过MobileNet V3
结论与展望
该框架成功实现"模型压缩+时序特征提取"双突破,未来可扩展至多模态医疗数据分析。值得注意的是,蒸馏过程使学生网络对ECG信号中的基线漂移噪声鲁棒性提升40%,为可穿戴设备实时诊断提供新可能。
创新点
• 首次将PrefixSpan算法用于心电序列周期模式挖掘
• 提出胶囊网络与注意力机制的混合蒸馏损失函数
• 通过ICOA算法实现超参数自适应调整
生物通微信公众号
知名企业招聘