
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:过敏研究中的机器学习:文献计量学综述
【字体: 大 中 小 】 时间:2025年09月10日 来源:Immunology Letters 2.8
编辑推荐:
这篇综述系统回顾了机器学习(ML)和人工智能(AI)在过敏研究中的应用,通过文献计量学方法分析了695篇文献,揭示了数据驱动技术如何推动过敏性疾病(如哮喘、湿疹)的异质性解析、精准医疗发展及电子健康记录(EHRs)分析,强调跨学科合作对临床转化的重要性。
哮喘、湿疹(特应性皮炎)和过敏性鼻炎等过敏性疾病具有高度异质性,患者临床表现、缓解周期和治疗反应差异显著。传统研究受限于数据和方法学的“孤岛效应”,而大数据和机器学习(ML)技术的兴起为解析疾病亚型、追踪进展及识别潜在机制提供了新工具。本文通过文献计量学分析,梳理了ML在过敏研究中的应用现状与未来方向。
ML与经典多变量统计方法既有联系又有差异。尽管深度学习等复杂模型在非结构化数据(如影像、文本)中表现优异,但其“黑箱”特性常受诟病。近年来,可解释AI(XAI)技术(如SHAP、LIME)的兴起正试图平衡模型准确性与可解释性,这对需要临床透明度的过敏研究尤为重要。监督与非监督学习各具优势:前者用于预测模型构建,后者则通过聚类分析(如k-means)揭示疾病表型,例如哮喘研究中已识别出嗜酸性粒细胞或中性粒细胞主导的炎症亚型。
通过Scopus数据库检索1975-2024年的文献,筛选出695篇ML/AI相关研究。检索词涵盖“过敏”“人工神经网络”“随机森林”等术语,并结合医学主题限制。采用文献计量学工具(如R包bibliometrix)分析合作网络、国家生产力及高引文献。
4.1 发表趋势
研究分为三个阶段:初始阶段(1975-2003年,年均1.46篇)、发展阶段(2004-2011年,年均10.86篇)和扩张阶段(2012-2024年,年均48.17篇)。美国以152篇文献和6570次引用领先,瑞典和英国分列二、三位。
4.2 核心主题
关键词共现网络识别出四大主题:
哮喘与特应性疾病(红):聚焦哮喘、湿疹和过敏性鼻炎的共病机制,挑战“特应性进程”线性假说。
EHRs的AI分析(蓝):利用自然语言处理(NLP)挖掘药物过敏(如COVID-19用药不良反应)和花粉暴露预测。
疾病异质性与精准医疗(绿):通过聚类分析(如严重哮喘研究计划SARP)定义嗜酸性粒细胞/IL-5相关内型,指导靶向治疗。
食物过敏与IgE致敏(紫):基于微阵列技术的组分解析诊断(CRD)改善交叉反应性食物过敏管理。
4.3 潜在狄利克雷分布(LDA)主题模型
十大主题进一步细化上述方向,例如“慢性症状与风险”(主题3)、“细胞因子表达”(主题5)和“IgE介导的超敏反应”(主题1)。
ML/AE在过敏研究中展现出解析复杂机制和优化临床决策的潜力,但需警惕“数据大而美不足”的陷阱。未来需强化跨学科团队科学(Team Science),整合临床(如医生)与计算(如分析师)视角,推动可解释模型向临床 actionable solutions 转化。
生物通微信公众号
知名企业招聘