
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于神经网络AI模型的肺音信号多频段特征分析与肺部疾病精准诊断研究
【字体: 大 中 小 】 时间:2025年07月13日 来源:Scientific Reports 3.8
编辑推荐:
研究人员针对肺部疾病诊断中人工听诊效率低、传统AI模型泛化性不足的问题,开发了基于神经网络(NN)的肺音信号分析系统。通过零相位滤波器组分解肺音信号为8个子频段,提取熵/Lp范数等特征,采用4层轻量级NN架构实现跨数据集验证。在ICBHI和KAUH数据集上达到100%准确率/灵敏度/特异性,为临床提供高效自动化诊断工具。
肺部疾病是全球第三大死亡原因,传统听诊方法高度依赖医生经验且效率低下。尽管已有研究尝试用AI分析肺音信号,但多数存在模型复杂、泛化性差等问题——有的仅在单一数据集表现良好,有的需要复杂预处理步骤。更棘手的是,肺音信号具有非线性、非平稳特性,且不同疾病(如哮喘、COPD、肺炎)的声学特征存在重叠,这对自动化诊断系统提出了严峻挑战。
针对这些瓶颈,Netaji Subhas University of Technology的研究团队在《Scientific Reports》发表了一项突破性研究。他们创新性地将傅里叶零相位滤波与轻量级神经网络相结合,开发出可跨数据集泛化的肺病诊断系统。该系统通过8个均匀分布的频段滤波器(125-1750Hz)分解肺音信号,从每个子频段提取熵、Lp范数(p=0.25,0.5)、峰度等6维特征,输入仅含4层(64-32-16-z节点)的NN架构。关键技术包括:1) 使用4000Hz重采样和3秒帧分割标准化输入;2) 通过零相位滤波器消除心音噪声(0.5-150Hz)并保留肺音特征(100-2000Hz);3) 采用Adam优化器和0.25 dropout率防止过拟合;4) 在ICBHI、KAUH及其组合数据集上验证性能。
研究团队首先构建了5个数据集:ICBHI(920例)、KAUH(337例)、组合数据集(1257例)、慢性/非慢性分类数据集(1257例)及外部测试集(COPD五级严重度数据)。信号预处理采用最小-最大归一化(公式1)消除幅度差异,通过零相位滤波器(公式2-4)实现无相位失真的频带分割。特征提取阶段创新性地组合时域(均值绝对偏差MAD)和频域特征(谱熵Entj),形成40维特征向量(8频段×5特征)。NN架构中ReLU激活函数(公式10)的引入有效解决了梯度消失问题。
模型在四类任务中均达100%指标:1)二分类(正常vs COPD/哮喘等)2)多分类(8种疾病)3)慢性度分类4)外部数据集测试。特别值得注意的是,在Leave-One-Subject-Out验证中仍保持90.02-95.73%准确率,证明其临床适用性。t-SNE可视化显示不同疾病特征明显可分,

这项研究突破了传统AI模型在肺音分析中的三大局限:1) 通过零相位滤波保留病理特征;2) 轻量级NN实现床旁实时诊断(单样本351ms);3) 首个在8类疾病跨数据集验证的模型。未来可扩展至COVID-19等新兴呼吸道疾病检测,或与电子听诊器集成形成便携设备。作者在讨论中指出,当前模型对12通道肺音数据的处理仍有优化空间,下一步拟引入注意力机制提升重症识别精度。
这项由Umaisa Hassan领衔的研究,为呼吸系统疾病的早期筛查提供了革命性工具——其100%的敏感度意味着可有效避免漏诊,而100%特异度能大幅减少不必要的侵入性检查。正如论文强调的,这种"信号分解+轻量NN"的技术路线,为其他生物信号(如心音、胃肠音)分析提供了普适性框架。
生物通微信公众号
知名企业招聘