编辑推荐:
为解决生物医学信号分类中计算成本高、多模态信号分类缺乏、可解释模型有限等问题,研究人员开展基于序转换模式(OTPat)的可解释特征工程(XFE)模型研究。结果显示该模型在多种数据集上准确率超 95%,为生物医学信号分类提供新方案。
在现代医学领域,生物医学信号如脑电图(EEG)和心电图(ECG),就像隐藏着人体健康秘密的神秘代码。EEG 能反映大脑的电活动,帮助医生了解大脑功能;ECG 则记录心脏的电信号,是诊断心脏疾病的重要依据。然而,这些信号复杂多变,每个人的信号特征都存在差异,就像不同的密码锁,很难用统一的方法准确解读。
近年来,虽然深度学习技术在生物医学信号分类中取得了不错的成绩,但它就像一个 “耗电大户”,需要强大的计算能力支持,而且其结果往往难以解释,就像一个黑匣子,让人摸不着头脑。同时,大多数研究只关注 EEG 或 ECG 单一信号分类,缺乏多模态的综合分析。此外,可解释的模型也非常有限,难以满足临床需求。
为了攻克这些难题,来自土耳其、澳大利亚等多个国家的研究人员携手合作 ,开展了一项意义重大的研究。他们提出了一种基于序转换模式(OTPat)的可解释特征工程(XFE)模型,旨在实现生物医学信号的高效分类,并让分类结果具有可解释性。
研究人员在研究中用到了几个关键技术方法:首先是 OTPat 特征提取器,它能够从信号通道和信号本身提取重要特征;其次是累积加权迭代近邻成分分析(CWINCA),用于选择最具信息量的特征;然后是 t 算法 k 近邻(tkNN)分类器,对信号进行分类;最后,使用 Directed Lobish(DLob)和 Cardioish 两种符号语言,将分类结果转化为可解释的连接体图。
研究结果主要包括以下几个方面:
- 模型性能评估:研究人员使用多个 EEG 和 ECG 数据集对模型进行测试。在 EEG 压力数据集、EEG 肌萎缩侧索硬化症(ALS)数据集和 ECG 心理健康数据集上,该模型的分类准确率分别达到了 99.07%、95.74% 和 100%,F1 分数和几何平均值也都超过了 95%。这表明模型在不同类型的生物医学信号分类任务中都表现出色。
- 可解释性分析:通过 DLob 和 Cardioish 符号语言,研究人员得到了可解释的结果。在压力检测中,发现额叶激活最为频繁,这意味着大脑在应对压力时,逻辑推理和情绪调节等功能区域被大量调用。对于 ALS 检测,额叶和顶叶的激活更为突出,反映出大脑在应对疾病时的神经适应性变化。在 ECG 心理健康检测中,Cardioish 符号的分布呈现出特定的模式,不同的心脏活动模式与不同的心理健康状况相关联。
- 额外数据集测试:研究人员还使用了一个包含八个类别的 EEG 伪影分类数据集对模型进行测试。结果显示,模型在该数据集上的分类准确率达到了 86.07%,并且发现额叶相关的符号在伪影分类中占主导地位。
在研究结论和讨论部分,该模型展现出诸多优势。它具有线性时间复杂度,相比深度学习模型,计算效率更高,就像一辆轻巧灵活的汽车,在处理数据时更加高效快捷。同时,它能够处理多模态信号,提供可解释的结果,为医生和研究人员理解生物医学信号背后的生理机制提供了有力的支持。通过分析不同数据集上的符号序列,研究人员发现了不同疾病状态下大脑和心脏活动的特征模式,这些发现有助于进一步了解疾病的发生发展机制。
这项研究成果发表在《Scientific Reports》上,为生物医学信号分类领域带来了新的希望。它不仅提高了分类的准确性和可解释性,还为未来开发更先进的医疗诊断工具奠定了基础,有望在临床实践中发挥重要作用,帮助医生更准确地诊断疾病,为患者提供更有效的治疗方案。