基于世界超启发式与模糊深度学习的胃癌代谢组学检测新方法WHFDL及其可解释性研究
【字体:
大
中
小
】
时间:2025年10月12日
来源:BioData Mining 6.1
编辑推荐:
本研究针对胃癌早期诊断中传统方法侵入性强、现有AI模型可解释性差等问题,开发了一种名为WHFDL(World Hyper-heuristic Fuzzy Deep Learning)的非侵入性诊断方法。研究人员通过世界超启发式算法(WHH)从血浆代谢组学数据中筛选出6个关键代谢物标志物(1-甲基腺苷、C18-肉碱等),并利用分层融合模糊深度神经网络进行分类,最终实现了94%的准确率和0.9384的AUC值。该研究为胃癌早期诊断提供了高精度且可解释的AI工具,对推动代谢组学在临床中的应用具有重要意义。
胃癌是全球范围内最常见的恶性肿瘤之一,其预后高度依赖于早期诊断。然而,传统的胃癌诊断方法如内窥镜检查具有侵入性、费用高昂且存在操作风险,这使得开发非侵入性诊断工具成为临床迫切需求。近年来,人工智能技术在癌症诊断领域展现出巨大潜力,但现有模型普遍面临可解释性差、对高维数据处理能力不足等挑战。特别是在代谢组学数据分析中,特征选择困难和模型"黑箱"问题严重制约了其临床转化应用。
为突破这些瓶颈,Nora Mahdavi等研究人员在《BioData Mining》杂志上发表了一项创新性研究,提出了一种名为WHFDL(World Hyper-heuristic Fuzzy Deep Learning)的新型胃癌检测方法。该方法巧妙地将世界超启发式算法与模糊深度学习相结合,实现了从血浆代谢组学数据中准确识别胃癌患者,同时保证了模型决策过程的透明度和可解释性。
研究团队收集了来自三家医院的702例血浆样本(389例胃癌患者和313例非癌对照),采用液相色谱-质谱联用技术(LC-MS)获取147种代谢物的定量数据。通过世界超启发式算法(WHH)进行特征选择,该算法整合了八种元启发式算法(如粒子群优化、差分进化等),利用强化学习动态平衡探索与利用,筛选出最具判别力的代谢物特征。随后,采用分层融合模糊深度神经网络(Hierarchical Fused Fuzzy Deep Neural Network)进行分类,该网络通过模糊表示分支处理数据不确定性,深度表示分支降低噪声干扰,融合模块整合两类特征,最终通过任务驱动层输出分类结果。
研究比较了四种特征选择方法(Filter、Wrapper、Embedded和Hybrid)的性能。WHH算法在传统机器学习模型(如CatBoost、QDA等)和深度学习模型(如RNN、LSTM等)中均表现出最优性能。特别是在与WHFDL模型结合时,准确率达到94%,显著优于其他特征选择方法。这表明WHH能够有效处理高维代谢组学数据,识别出最具生物学意义的特征子集。
WHFDL模型在14种分类器中表现最佳,准确率、精确率、召回率和F1-score均达到94%,AUC值为0.9384。与传统方法(如逻辑回归、支持向量机等)相比,WHFDL在胃癌检测方面表现出更好的平衡性,特别是在减少假阴性和假阳性方面具有明显优势。ROC曲线和混淆矩阵分析进一步验证了该模型的稳健性。
通过SHAP(SHapley Additive exPlanations)和LIME(Local Interpretable Model-agnostic Explanations)分析,研究确认了6个关键代谢物对模型预测的贡献度:1-甲基腺苷(1-Methyladenosine)、C18-肉碱(C18-Carnitine)、胍基乙酸(Guanidineacetic acid)、次黄嘌呤(Hypoxanthine)、烟酰胺单核苷酸(Nicotinamide mononucleotide)和琥珀酸(Succinate)。校准曲线显示模型预测概率与实际结果具有良好一致性,而对抗性测试表明模型对输入扰动具有适度鲁棒性(准确率从94%降至76%)。
UMAP可视化显示这6种代谢物能有效区分胃癌患者与健康对照。统计分析(Mann-Whitney检验)证实这些代谢物在两组间存在显著差异(p<0.05)。从生物学角度,这些代谢物涉及多个癌症相关通路:琥珀酸作为TCA循环中间体,可发挥癌代谢物功能;C18-肉碱与癌症代谢可塑性相关;次黄嘌呤反映嘌呤代谢紊乱;NMN参与NAD+代谢重编程等。这些发现与既往胃癌研究相吻合,证明了模型筛选特征的生物学合理性。
WHFDL模型成功整合了超启发式特征选择和模糊深度学习框架,在保持高精度的同时提升了模型可解释性。该方法不仅为胃癌早期诊断提供了可靠的非侵入性工具,还鉴定出一组具有临床价值的代谢标志物。研究局限性包括代谢物相对定量对数据标准化的依赖,以及模型对抗性攻击的敏感性。未来研究方向包括拓展多组学数据整合、开发绝对定量方法,以及通过对抗训练增强模型鲁棒性。这项研究为人工智能在癌症代谢组学中的应用提供了新范式,推动了精准医疗的发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号