编辑推荐:
冠心病(CHD)致死率高,为评估其风险,研究人员开展基于人工神经网络(ANN)的智能医疗系统研究。结果显示,Adam 优化器结合 ReLU 激活函数及特定采样方法效果最佳,准确率达 96.25% ,为 CHD 风险预测提供支持。
在当今社会,心血管疾病已然成为威胁人类健康的 “头号杀手”,其中冠心病(Coronary Heart Disease,CHD)更是导致全球高死亡率的重要原因。它就像一颗 “定时炸弹”,悄悄地潜伏在人们身边,通过狭窄心脏供血血管,阻碍氧气输送,严重时引发致命后果。不仅如此,冠心病的治疗费用高昂,给患者家庭和社会都带来了沉重的经济负担。传统的诊断方法既耗时又昂贵,而现有的机器学习预测模型也存在计算效率低、易过拟合等问题。在这样的背景下,开展一项能高效预测冠心病风险的研究显得尤为迫切。
为了攻克这一难题,来自中央 Institute of Technology Kokrajhar 和 Dayananda Sagar University 的研究人员踏上了探索之旅。他们致力于开发一种基于人工神经网络(Artificial Neural Network,ANN)的智能医疗系统,期望能更精准地预测冠心病风险。经过不懈努力,研究取得了令人瞩目的成果,相关论文发表在《Scientific Reports》上。
研究人员开展的这项研究,核心在于利用 ANN 架构构建冠心病未来风险的智能决策支持系统。他们深入探究不同优化技术和激活函数对 ANN 架构在冠心病预测模型中的影响,同时优化模型的学习率、权重等参数,以降低损失函数,提升模型性能。
在研究过程中,研究人员运用了多个关键技术方法。首先,从公开的 Kaggle 仓库获取包含 4240 个数据实例和 15 个潜在风险因素的 Framingham Heart Study(FHS)数据集。接着对数据进行预处理,包括用 “fillna” 函数和均值、众数等方法替换空值,计算 Pearson 相关系数分析数据相关性,使用 “StandardScaler” 函数进行特征缩放,以及采用 SMOTE、SMOTETomek 和 SMOTEENN 等过采样技术平衡目标类数据。之后,基于 Keras 和 TensorFlow 库构建 ANN 模型,模型包含一个输入层、四个隐藏密集层和一个输出层,使用不同优化器(如 Adam、SGD、RMSProp 和 AdaDelta)和激活函数(ReLU 和 LeakyReLU)进行训练和测试,并通过调整学习率、批大小和 epoch 等参数优化模型。最后,利用二元交叉熵、准确率、召回率和 F1 分数等指标评估模型性能123。
下面来看具体的研究结果:
- 模型训练与性能评估:在控制模型过拟合和欠拟合的实验中,研究人员设置了多个参数,如批大小为 32、epoch 数为 100,以及不同层的 dropout 率在 0.2 - 0.5 之间变化。在初始预测模型部署时,使用 Adam 优化器结合 ReLU 和 LeakyReLU 激活函数,发现 LeakyReLU 的表现更好,验证准确率达到 86.79% 。之后,在应用 SMOTE 过采样技术后,对不同优化器进行测试,结果显示 Adam 优化器的效果优于其他优化器,例如使用 Adam 优化器结合 ReLU 激活函数时,验证准确率可达 93.75% 。
- 不同采样技术的影响:研究人员进一步应用 SMOTETomek 和 SMOTEENN 等过采样技术,发现这些技术与 Adam 优化器和 ReLU 激活函数结合时,能进一步提高模型性能。例如,经过 SMOTETomek 采样后,验证准确率达到 93.98% ;经过 SMOTEENN 采样后,验证准确率达到 94.53% 。而将 SMOTEENN 和 SMOTETomek 的顺序效应结合使用时,模型达到了最高的验证准确率 96.25% ,且召回率高达 0.98,这表明模型能有效识别出大部分实际患病的情况45。
- 与其他技术的比较:与其他使用 FHS 数据集的研究相比,该研究提出的方法在不使用特征消除技术的情况下,通过调整模型参数控制过拟合风险,取得了更高的准确率。这显示出该研究中 ANN 模型设计、优化技术以及数据预处理方法的有效性6。
研究结论和讨论部分指出,Adam 优化器结合 ReLU 激活函数以及 SMOTEENN 和 SMOTETomek 的两阶段采样方法,在冠心病风险预测方面表现卓越,验证准确率高达 96.25% ,验证损失低,召回率高,这意味着模型能高效、准确地预测冠心病风险,为临床诊断提供有力支持。同时,研究中使用的优化技术和激活函数,以及精心设计的 ANN 架构,在处理复杂的非线性关系和自动提取特征方面表现出色,这为未来的冠心病预测研究提供了新的思路和方法。此外,该研究也存在一定局限性,如数据收集的困难和安全隐私问题。但研究人员提出可通过采用联邦学习方法解决这些问题,并计划在未来使用更多样化的大数据集和自然启发的进化算法,进一步提升研究成果的准确性和实用性。
总的来说,这项研究为冠心病的早期预测开辟了新途径,其成果有助于提高冠心病的防治水平,为全球心血管疾病的研究和治疗提供了重要的参考和借鉴,在生命科学和健康医学领域具有重要的意义和价值。