基于神经网络AI模型的肺音信号多频段特征分析与肺部疾病精准诊断研究

【字体: 时间:2025年07月13日 来源:Scientific Reports 3.8

编辑推荐:

  研究人员针对肺部疾病诊断中人工听诊效率低、传统AI模型泛化性不足的问题,开发了基于神经网络(NN)的肺音信号分析系统。通过零相位滤波器组分解肺音信号为8个子频段,提取熵/Lp范数等特征,采用4层轻量级NN架构实现跨数据集验证。在ICBHI和KAUH数据集上达到100%准确率/灵敏度/特异性,为临床提供高效自动化诊断工具。

  

肺部疾病是全球第三大死亡原因,传统听诊方法高度依赖医生经验且效率低下。尽管已有研究尝试用AI分析肺音信号,但多数存在模型复杂、泛化性差等问题——有的仅在单一数据集表现良好,有的需要复杂预处理步骤。更棘手的是,肺音信号具有非线性、非平稳特性,且不同疾病(如哮喘、COPD、肺炎)的声学特征存在重叠,这对自动化诊断系统提出了严峻挑战。

针对这些瓶颈,Netaji Subhas University of Technology的研究团队在《Scientific Reports》发表了一项突破性研究。他们创新性地将傅里叶零相位滤波与轻量级神经网络相结合,开发出可跨数据集泛化的肺病诊断系统。该系统通过8个均匀分布的频段滤波器(125-1750Hz)分解肺音信号,从每个子频段提取熵、Lp范数(p=0.25,0.5)、峰度等6维特征,输入仅含4层(64-32-16-z节点)的NN架构。关键技术包括:1) 使用4000Hz重采样和3秒帧分割标准化输入;2) 通过零相位滤波器消除心音噪声(0.5-150Hz)并保留肺音特征(100-2000Hz);3) 采用Adam优化器和0.25 dropout率防止过拟合;4) 在ICBHI、KAUH及其组合数据集上验证性能。

方法论创新

研究团队首先构建了5个数据集:ICBHI(920例)、KAUH(337例)、组合数据集(1257例)、慢性/非慢性分类数据集(1257例)及外部测试集(COPD五级严重度数据)。信号预处理采用最小-最大归一化(公式1)消除幅度差异,通过零相位滤波器(公式2-4)实现无相位失真的频带分割。特征提取阶段创新性地组合时域(均值绝对偏差MAD)和频域特征(谱熵Entj),形成40维特征向量(8频段×5特征)。NN架构中ReLU激活函数(公式10)的引入有效解决了梯度消失问题。

跨数据集验证

模型在四类任务中均达100%指标:1)二分类(正常vs COPD/哮喘等)2)多分类(8种疾病)3)慢性度分类4)外部数据集测试。特别值得注意的是,在Leave-One-Subject-Out验证中仍保持90.02-95.73%准确率,证明其临床适用性。t-SNE可视化显示不同疾病特征明显可分,

印证了特征提取的有效性。与现有技术对比(表8),该模型将STFT-CNN-SVM(65.5%)等方法的准确率提升至100%,且训练时间仅6秒/epoch。

临床价值与展望

这项研究突破了传统AI模型在肺音分析中的三大局限:1) 通过零相位滤波保留病理特征;2) 轻量级NN实现床旁实时诊断(单样本351ms);3) 首个在8类疾病跨数据集验证的模型。未来可扩展至COVID-19等新兴呼吸道疾病检测,或与电子听诊器集成形成便携设备。作者在讨论中指出,当前模型对12通道肺音数据的处理仍有优化空间,下一步拟引入注意力机制提升重症识别精度。

这项由Umaisa Hassan领衔的研究,为呼吸系统疾病的早期筛查提供了革命性工具——其100%的敏感度意味着可有效避免漏诊,而100%特异度能大幅减少不必要的侵入性检查。正如论文强调的,这种"信号分解+轻量NN"的技术路线,为其他生物信号(如心音、胃肠音)分析提供了普适性框架。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号