TriSpectraKAN 模型:开启 COPD 低成本实时诊断新时代,AI 赋能呼吸疾病诊疗新突破

【字体: 时间:2025年02月22日 来源:Scientific Reports 3.8

编辑推荐:

  为解决 COPD 传统诊断方法的不足,作者[第一作者单位] 研究人员开展基于音频特征的 TriSpectraKAN 模型研究。结果显示该模型诊断准确率达 93%,F1 分数 0.98 等。推荐阅读,一同探索 AI 助力 COPD 诊断的创新成果。

  
在全球范围内,慢性阻塞性肺疾病(COPD)如同一个隐匿的健康杀手,严重威胁着人们的生命健康。它以肺部气流受限为特征,不仅让患者的生活质量大打折扣,还大大增加了过早死亡的风险。吸烟是导致 COPD 的主要原因,在很多地区,高达 90% 的病例都与吸烟有关。不过,环境、职业和遗传等因素也在这个疾病的发生发展过程中扮演着重要角色,它们相互交织,让 COPD 的防治变得更加复杂。

对于 COPD 患者来说,早期诊断至关重要,这就像是在疾病的发展道路上设置了一道关卡,能有效改善患者的生活质量。然而,现有的诊断方法却存在不少问题。传统的诊断手段往往需要借助专门的设备,还得依靠专业人员操作,这使得诊断成本居高不下,在基层医疗单位很难普及。对于那些医疗资源相对匮乏地区的人们来说,想要及时、准确地诊断 COPD 更是难上加难。所以,开发一种既可靠又准确,还能自动检测 COPD 的方法,成为了医学领域亟待解决的难题。

为了攻克这个难题,研究人员们积极探索。其中,作者[第一作者单位] 的研究人员在《期刊原文名称》上发表了一篇名为《论文原文标题》的论文。他们通过一系列研究,得出了令人振奋的成果。研究表明,他们提出的 TriSpectraKAN 模型在 COPD 检测方面表现出色,有着很高的诊断准确率。而且,这个模型还能部署在树莓派(Raspberry Pi)上,实现低成本、便携式的实时诊断,这对于改善全球 COPD 的诊断现状有着重要意义。

研究人员在这项研究中运用了多种关键技术方法。他们收集了来自 ICBHI 2017 数据集、阿卜杜拉国王大学(KAU)数据集和 Respiratory Database@TR(RD@TR)的数据,这些数据包含了丰富的呼吸声音信息。在数据处理阶段,研究人员先对音频进行重采样、修剪或填充,将其标准化为固定长度,接着提取 Mel 频率倒谱系数(MFCC)、色度图(chromagram)和 Mel 频谱图(mSpec)这三种特征。之后,他们利用子 CNN 模型分别处理这些特征,并将其融合,构建出 TriSpectraKAN 模型。该模型结合了频谱特征和 Kolmogorov–Arnold 网络(KAN),通过独特的结构对融合后的特征进行分析。

下面让我们详细看看研究的具体结果:

  • 评估指标:研究人员采用了准确率、特异性、敏感性、精确率和 F1 分数等指标来评估模型的性能。这些指标就像是衡量模型表现的尺子,通过它们可以准确地判断模型在 COPD 诊断中的能力。
  • 性能评估:研究人员使用了包含六个类别的不平衡数据集进行多类分类,其中 COPD 类的肺音样本数量最多。经过训练和优化,TriSpectraKAN 模型表现优异,平均准确率达到 95.22%,特异性为 97.6%,敏感性为 97.4%,精确率为 97.4%,F1 分数为 97.8%。通过观察训练和验证的准确率曲线以及损失曲线,发现曲线平缓且波动小,这表明模型学习效果好,不会出现过拟合的情况,在面对新数据时也能保持良好的性能。与其他模型对比,如 RNN、LSTM、SVM 和 ARIMA 等,TriSpectraKAN 模型在准确率和损失降低方面都更胜一筹,在 COPD 类别的分类中,其最大准确率达到 93%,召回率达到 98%。不过,模型在其他类别上的表现有所差异,例如 URTI 的 F1 分数仅为 55%,这说明模型在识别一些不太常见的疾病或症状相似的疾病时还存在一定困难。
  • 对比分析:研究人员将自己的方法与其他相关研究进行对比。以往的研究中,基于机器学习(ML)的方法最高准确率为 63.09%,深度学习(DL)方法虽然有所提高,但在一些研究中准确率仍不尽人意。而本次研究中的 TriSpectraKAN 模型在各项指标上都表现更优,其架构在模型复杂度和特征提取之间找到了平衡,有效避免了过拟合问题,展现出更强的鲁棒性和泛化能力。
  • 解决类别不平衡和数据稀缺问题:面对数据集中类别不平衡以及除 COPD 外其他类数据样本有限的问题,研究人员通过混淆矩阵和 ROC 分析发现,TriSpectraKAN 模型在 COPD 分类上表现卓越,其 AUC 达到 0.98,远高于其他模型,这表明该模型能很好地区分 COPD 和健康案例。
  • 准确率和损失曲线:从训练和验证曲线可以看出,模型的准确率曲线和损失曲线都很平缓,波动极小。这意味着模型能够有效地从训练数据中学习,并且不会过度拟合,验证准确率高达 0.95 以上,说明模型在处理新数据时具有良好的性能。
  • F1 分数:TriSpectraKAN 模型在 COPD 类别上的 F1 分数达到 98%,表现非常出色,这得益于 COPD 类别的样本数量相对较多。对于其他类别,虽然 F1 分数没有 COPD 那么高,但也能做出合理的预测,这在数据不平衡的情况下显得尤为可贵。不过,由于数据不平衡的影响,模型在不同类别上的表现存在差异,后续还需要进一步研究来提高模型对少见疾病或症状相似疾病的识别能力。
  • 真实受试者结果:为了验证模型在现实中的有效性,研究人员收集了来自印度全印医学科学研究所(AIIMS)赖布尔分院肺病科的真实数据,包括 COPD 患者、健康人和支气管扩张患者的肺音样本。他们将训练好的模型部署在树莓派上进行实时分析,结果显示模型能准确预测大部分病例,尤其是在 COPD 的识别上表现出色,不过在区分健康人的肺音模式时还需要进一步优化。这一结果表明模型在实际应用中具有很大的潜力。

总的来说,这项研究意义重大。研究人员提出的 Hybrid Kolmogorov Arnold Network(KAN)模型为 COPD 的检测带来了新的希望。它融合多种音频特征,大大提高了 COPD 检测的准确性,比传统模型更具优势。而且,该模型成功部署在树莓派上,成为了一种便携式、低成本且能实时诊断的工具,特别适合在资源有限的地区使用。通过真实世界的验证,也证明了模型在不同呼吸疾病诊断中的可靠性。

不过,研究人员也清楚,还有很多工作需要继续推进。未来,他们计划进一步优化模型的超参数,整合更多的临床数据,尝试运用元学习技术提高模型的适应性,在更大、更多样化的数据集上进行验证,还打算开展全面的临床研究,评估模型在现实世界中的适用性。这些努力的最终目标,是让这个模型更加准确、可靠,成为早期 COPD 诊断的得力助手,帮助医生更早地发现疾病,从而改善患者的治疗效果,降低医疗成本,为全球抗击 COPD 贡献重要力量。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号