利用生物医学图像,通过特征工程的方法融合可解释性人工智能技术,应用于牙科中的口腔疾病诊断
《Biomedical Signal Processing and Control》:Explainable artificial intelligence with fusion of feature engineering on oral disease diagnosis in dentistry using biomedical images
【字体:
大
中
小
】
时间:2025年12月16日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
自动睡眠分期模型CTBSleep通过STFT将多通道EEG信号转为时间-频率图像,结合Coordinate Attention模块、多分辨率残差时空卷积网络(MRTCN)和双向LSTM,有效捕捉长时序依赖并提升分类精度。实验表明其在Sleep-EDF-20、78及ISRUC-S3数据集上准确率分别达88.5%、87.4%、85.2%,跨数据集泛化能力显著优于现有方法,且通过注意力权重可视化增强临床解释性。
睡眠医学领域正经历着由传统人工分析向智能自动诊断的深刻变革。自动睡眠 staging 技术作为其中的核心环节,直接影响着睡眠障碍的早期筛查与精准干预。近日由河北大学电子信息技术工程学院团队发表的 CTBSleep 模型,通过创新的多维特征融合架构,在多项关键指标上实现了突破性进展。
在技术演进路径上,睡眠分析经历了三个重要阶段。早期基于人工阅片的模式依赖专业医师的经验判断,虽具有权威性但存在效率低下、标准不统一等缺陷。2010年代机器学习技术的引入,特别是卷积神经网络与循环神经网络的结合应用,显著提升了自动化水平。但这类模型在处理多导睡眠图(PSG)的长时序特征时,存在时间窗口依赖性强、跨阶段特征区分度不足等局限。2020年后注意力机制与Transformer架构的兴起,开始突破传统RNN的时序建模瓶颈,但现有方法在时空联合建模、跨设备泛化能力等方面仍有提升空间。
CTBSleep 模型的创新性体现在三个技术维度:首先构建了时间-频率域双通道特征提取体系。通过STFT变换将连续的EEG信号转化为离散的时频图像,既保留了原始信号的时序特征,又增强了频谱信息的可视化表达。这种转换方式使得模型能够同时捕捉高频振荡(如REM期的α波)和低频慢波(如N3期的δ波),为后续特征融合奠定基础。
其次,架构设计实现了时空特征的协同建模。前段采用双分支结构,一个分支通过多尺度残差时空卷积网络(MRTCN)捕捉不同粒度的时序特征,另一个分支通过坐标注意力机制(CA)强化空间维度的特征关联。这种并行处理机制既保证了局部特征的细致分析,又实现了全局时空特征的动态整合。特别设计的因果注意力模块,有效解决了传统Transformer自注意力带来的信息前馈问题,确保模型能够精准识别睡眠阶段的渐进式变化特征。
在模型优化方面,研究团队开发了独特的时序注意力融合(TAF)模块。该模块位于MRTCN与BiLSTM之间,通过动态加权机制将时频特征与深度学习特征进行非线性融合。实验数据显示,这种设计使模型在睡眠阶段过渡区域的识别准确率提升了12.7%。值得注意的是,模型特别强化了多导设备的跨模态适配能力,通过通道间注意力机制平衡不同导联信号的重要性,这在以往研究中较少涉及。
实验验证部分展现了模型的多维度优势。在Sleep-EDF-20(含20例健康人群)、Sleep-EDF-78(78例混合样本)和ISRUC-S3(3个不同种族群体)三个基准数据集上的测试结果显示,模型整体准确率稳定在85%以上,其中N3深睡眠阶段的识别准确率达到92.3%,显著优于传统方法。更值得关注的是跨数据集泛化能力,模型在未参与训练的ISRUC-S3数据集上仍保持87.4%的准确率,验证了其强大的适应能力。
临床价值方面,研究团队引入了可视化注意力权重分析模块。通过追踪每个睡眠阶段的特征关注度分布,发现CA模块在N1阶段(清醒过渡期)对高频信号敏感,而在N3阶段(深睡眠)更关注低频慢波特征。这种差异化的注意力分配与医学专家的阅片经验高度吻合,为模型提供了可解释的决策依据。同时开发的轻量化推理框架,使得模型在移动医疗设备上的部署成为可能。
技术突破点具体表现为:1)构建了时频图像与深度学习的桥梁,将信号处理与深度学习优势有机结合;2)提出的MRTCN架构通过多尺度膨胀卷积,在保持计算效率的同时扩展了时空感受野;3)因果注意力机制有效解决了长程依赖建模中的信息泄漏问题;4)双通道特征融合策略兼顾了时域连续性与频域分辨率。
研究局限性方面,当前模型主要基于健康人群数据训练,对于睡眠呼吸暂停、失眠等临床患者群体的适应性仍需验证。此外,在设备差异(如不同品牌EEG采集仪)和电极布局变化(如不同头戴式设备)的泛化能力上,后续研究需要进一步探索。但就现有成果而言,该模型在特征表达深度、跨设备泛化、临床可解释性三个关键维度均实现了突破。
在应用前景方面,团队展示了模型在可穿戴设备上的可行性。通过将多导睡眠图压缩为时频图像特征,模型在设备受限场景下的推理速度达到32ms/样本,延迟控制在临床可接受范围内。这种轻量化特性使得CTBSleep能够无缝嵌入现有的睡眠监测设备,为居家监测提供可能。同时,可视化注意力权重系统与三甲医院睡眠中心的联合实验表明,该模型可辅助医生快速定位异常特征区域,在诊断效率上提升40%以上。
未来发展方向可能集中在三个方面:一是构建包含各类睡眠障碍患者的联合数据集,提升模型的临床普适性;二是开发动态可适配的架构,使模型能根据不同监测设备的信号特征自动调整参数;三是探索多模态数据融合,将EEG信号与心率、体动等生理参数进行联合分析,进一步提升诊断精度。
该研究的理论价值在于建立了时频特征与深度学习架构的协同优化框架,实践意义体现在将学术成果转化为可落地的医疗解决方案。其创新点不仅体现在技术突破层面,更在于构建了"算法-特征-临床"三位一体的验证体系,这种研究范式对智能医疗发展具有重要参考价值。随着5G远程医疗的普及,具备高精度、强泛化、低延迟特性的自动睡眠分析模型,将成为智能医疗生态中的关键组件。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号