TRA:用于自动睡眠分期阶段的轨迹检索增强模型

《Biomedical Signal Processing and Control》:TRA: Trajectory retrieval augmented model for automatic sleep staging

【字体: 时间:2025年11月09日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  自动睡眠分阶段技术通过轨迹检索增强与Siamese多尺度特征提取缓解数据稀缺问题,显著提升模型性能与鲁棒性。

  自动睡眠分期在评估睡眠质量和诊断睡眠障碍方面发挥着至关重要的作用。尽管现有的基于深度学习的方法在一定程度上推动了这一任务的发展,但它们的进一步应用和研究仍然受到临床标注数据稀缺的严重限制。为了解决这一问题,我们提出了一种名为轨迹检索增强(Trajectory Retrieval Augmented,简称TRA)的框架。该框架通过引入轨迹检索机制,从数据集中检索出高度相似且类别一致的序列,从而缓解数据稀缺的问题。此外,我们还设计了一个孪生多尺度特征提取模块,用于编码更具判别性的类别一致表示,从而显著提升模型性能。与五种基线方法的比较实验表明,所提出的方法在宏F1分数上提高了3.84%,在准确率上提高了2.75%,在Cohen’s Kappa上提高了3.21%。这些结果验证了我们的方法能够有效克服数据稀缺带来的性能瓶颈,从而实现更准确的睡眠分期,提高睡眠质量评估的可靠性。

睡眠对于免疫调节、代谢过程、记忆巩固以及心理健康具有重要作用。睡眠相关障碍,如失眠、发作性睡病(narcolepsy)和阻塞性睡眠呼吸暂停综合征(obstructive sleep apnea syndrome),已被广泛认为与多种身体和心理疾病密切相关。睡眠分期作为评估个体睡眠状态和睡眠质量的重要手段,不仅为临床医生提供了客观的诊断依据,还为睡眠障碍的早期检测和干预提供了基础支持。然而,我们的调查结果显示,高达92.3%的受访者在手动分期任务中感到显著疲劳,且对补偿的要求普遍较高。这一结果反映了当前手动分期实践的三大局限性:首先,分期过程耗时且效率低下;其次,结果的解释高度依赖于专家的主观经验和专业水平;最后,不同评估者之间的一致性水平差异较大。这些因素共同导致了临床筛查中睡眠障碍的高成本和低可扩展性,严重限制了睡眠医学的推广和应用。

由于自动化睡眠分期方法的高劳动成本,近年来相关技术成为研究热点。许多基于神经网络的模型被提出,旨在降低人工成本的同时提高分期的准确性。例如,Ji等人提出了一种基于三维卷积神经网络(3D-CNN)的模型架构,通过联合建模邻近脑区的信号,实现了不同脑区之间时空特征的融合表达,从而更高效地捕捉睡眠信号的判别性特征,并提升多阶段睡眠识别任务中的模型性能。此外,一种基于迁移学习的个体自适应架构也被提出,用于提取与目标任务相关的信息并识别具有显著个体差异的脑电波形。该架构能够准确捕捉信号在个体间的变异性,从而增强模型对个体特征的敏感性和识别能力。尽管上述方法在提高自动化睡眠分期性能方面取得了一定进展,但在缓解由数据稀缺引发的核心挑战方面仍存在局限。

检索增强生成(Retrieval-Augmented Generation,RAG)是一种能够高效检索相关样本以提升生成效果的方法。它在多个领域中受到了越来越多的关注。例如,Bahr等人将知识图谱整合到RAG框架中,显著提升了故障模式与影响分析(FMEA)的性能,通过增强语义分析和问答能力。同样,Alawwad等人利用RAG检索概念相关的信息,并结合迁移学习,解决了教科书问答系统中存在的推理能力弱和难以处理长上下文输入等问题。这些研究展示了基于RAG的方法在应对领域特定数据挑战方面的实用性和创新性。

受上述研究的启发,本文提出了一种插件式检索增强框架,称为TRA(Trajectory Retrieval Augmented)。该框架由三个核心模块组成:聚类模块、轨迹检索模块和孪生多尺度特征提取模块。其中,聚类模块负责构建高质量的检索池,轨迹检索模块通过从检索池中检索相似样本,补充特征的多样性,从而增强模型训练效果。这种设计在少样本学习场景中尤为有效,能够缓解因数据有限导致的准确率下降问题。孪生多尺度特征提取模块则在任务中发挥关键作用,它首先从检索到的样本和原始样本中提取关键特征,并将其转换为高维表示,确保更准确地捕捉判别性和一致性特征。这些特征随后通过信息融合策略进行整合,从而增强模型的判别能力,并有效应对数据稀缺和类别不平衡带来的挑战。此外,该模块设计为可无缝集成到其他模型中,真正体现了插件式的灵活性。这种模块化架构不仅提高了框架的灵活性和可扩展性,还为在多样化的应用场景中优化模型性能提供了新颖且实用的解决方案。

TRA框架在分类准确性方面也取得了显著提升,特别是在N1等代表性不足的睡眠阶段上表现尤为突出。同时,该框架还增强了模型的鲁棒性,使其在数据稀缺或类别不平衡的情况下仍能保持良好的性能。由于其插件式的特性,TRA可以轻松地与多种现有的睡眠分期模型(如AttnSleepNet、TS-TCC、IIT-Net)结合,而无需对原有模型的结构进行重大修改,从而提高了睡眠分期系统的灵活性和适用性。

为了验证所提出方法的有效性,我们进行了广泛的实验。实验结果表明,TRA能够显著减轻有限训练数据对模型性能的负面影响,从而大幅提升自动化睡眠分期模型的准确性和鲁棒性。本文的主要贡献可以总结为以下三个方面:

首先,我们提出了一种轨迹检索增强(TRA)框架,建立了跨样本轨迹相似性检索机制,以丰富特征表示。该方法有效缓解了N1样本的稀缺问题,并在基线模型如AttnSleep的基础上,使宏F1分数提高了9.48%,从而提升了自动化睡眠分期模型的鲁棒性和整体性能。

其次,我们设计了一个孪生多尺度特征提取模块,通过参数共享将原始序列和检索序列映射到统一的特征空间,以学习更具判别性的高维表示。该模块具有良好的模块化和可扩展性,能够无缝集成到现有的自动化睡眠分期模型中,不仅有效提升了分类性能,还为未来构建和集成更复杂的架构提供了潜力。

最后,我们在五个基线模型上进行了实验。结果表明,我们的框架具有广泛的应用性,能够无缝插入到任何模型中,平均性能提升了2.28%,在宏F1分数上最高提升了3.84%。这些实验结果充分证明了TRA框架在提升睡眠分期模型性能方面的有效性。

在相关工作的回顾部分,我们简要探讨了与本文工作密切相关的两个研究领域:自动化睡眠分期和检索增强方法。自动化睡眠分期主要依赖于生理信号,以自动识别和分类不同的睡眠阶段。根据美国睡眠医学会(AASM)的指南,睡眠通常被划分为五个阶段:清醒(Wake)、非快速眼动(NREM)阶段N1、N2和N3,以及快速眼动(REM)睡眠。每个阶段都有其独特的生理模式和脑电图特征。检索增强方法则通过引入外部信息,提升模型的生成能力,使其在面对数据稀缺或类别不平衡的情况下仍能保持较高的性能。

在数据集描述部分,我们介绍了广泛用于睡眠分期分类研究的Sleep-EDF-20数据集。该数据集包含20名受试者的多导睡眠图(polysomnographic)记录,总计39个夜晚。其中,受试者#13仅有一个夜晚的记录,其余受试者各有两天的数据。对于每段记录,提供了两个脑电(EEG)通道:Fpz-Cz和Pz-Oz。睡眠记录被分割为非重叠的30秒片段,遵循标准的睡眠评分协议。所有信号均经过标准化处理,以确保实验的可重复性和结果的可靠性。

在结论部分,我们总结了本文提出的方法,即TRA框架,该框架旨在解决自动化睡眠分期中的两个关键挑战:数据稀缺和类别不平衡。通过系统地整合聚类、轨迹检索和连接的孪生多尺度特征提取模块,该框架显著提升了基线模型的分类性能。与当前最先进的方法相比,我们的方法在宏F1分数上实现了3.84%的提升,证明了其在实际应用中的有效性。

本文的作者贡献声明指出,所有作者都参与了原始稿件的撰写。声明中提到,Sheng Xu的贡献得到了国家大学生创新创业训练计划的资助,其他作者则表示他们没有已知的潜在利益冲突。

总的来说,本文提出了一种创新性的TRA框架,通过引入轨迹检索机制和多尺度特征提取模块,有效缓解了数据稀缺和类别不平衡带来的挑战。该框架不仅提升了睡眠分期的准确性,还增强了模型的鲁棒性,为未来的睡眠医学研究和应用提供了新的思路和方法。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号