
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多尺度图分析揭示COVID-19与神经退行性疾病的共病机制:基于生物数据库与文本挖掘的系统研究
【字体: 大 中 小 】 时间:2025年08月02日 来源:Artificial Intelligence in the Life Sciences 5.4
编辑推荐:
为解决COVID-19与神经退行性疾病(NDDs)共病机制研究不足的问题,研究人员通过整合知识图谱(KGs)和自然语言处理(NLP)技术,系统分析了PrimeKG、DrugBank等数据库及文献数据。研究发现免疫反应基因和炎症标志物是两类疾病共享的关键通路,并构建了共病假说数据库。该研究为理解COVID-19对神经系统的长期影响提供了新视角,并为靶点发现奠定基础。
COVID-19大流行不仅对全球公共卫生造成冲击,还留下了许多未解之谜,尤其是其与神经退行性疾病(NDDs)如阿尔茨海默病(AD)和帕金森病(PD)的复杂关联。尽管两类疾病的研究文献浩如烟海,但它们的共病机制仍缺乏系统性探索。临床观察显示,NDDs患者感染COVID-19后死亡率更高,而康复者中神经系统后遗症频发,暗示两者可能存在深层次的生物学联系。然而,传统“单一疾病为中心”的研究模式难以揭示这种跨疾病的相互作用网络,亟需创新方法整合多源数据,从分子到表型层面解析共病机制。
针对这一挑战,德国弗劳恩霍夫算法与科学计算研究所(Fraunhofer Institute for Algorithms and Scientific Computing, SCAI)的研究团队开展了一项开创性研究。通过整合知识图谱(KGs)和文本挖掘技术,他们构建了首个覆盖COVID-19与NDDs的多尺度共病分析框架,相关成果发表在《Artificial Intelligence in the Life Sciences》上。
研究团队采用多管齐下的技术路线:首先从PrimeKG、DrugBank等6类生物数据库中提取疾病关联数据;其次通过PubMed检索和专家筛选获得201篇文献,利用Sherpa和PubTator3进行NLP实体关系抽取;最后通过Neo4j图数据库整合数据,运用最短路径分析和表型覆盖评估等算法挖掘共病机制。所有分析均基于真实临床队列和UK Biobank等公共数据集。
共享病理通路分析
通过跨知识图谱的最短路径分析,发现COVID-19与NDDs通过3-5跳路径显著关联,其中免疫基因TLR7和VEGFA是核心枢纽。例如在SCAI-DMaps中,APP(淀粉样前体蛋白)与氧化应激通路的交互揭示了AD与COVID-19共享的分子损伤机制。
表型覆盖验证
基于人类表型本体(HPO),研究发现两类疾病共同表现为神经炎症、认知衰退等23种临床特征。PrimeKG尤其突出了感官障碍(如听力损失)与海马凋亡等AD相关病理的关联。
共病假说数据库构建
整合GWAS数据发现,rs5117-C和rs13107325-T等SNP位点同时关联COVID-19重症与NDDs风险。富集分析显示一氧化氮(NO)信号通路和NF-κB激活通路是两类疾病的关键交叉点,其中IL-6介导的炎症反应可能是共病核心驱动因素。
方法学创新与验证
通过置换检验证实COVID-NDD关联的统计学显著性(p<0.001),而基于BERT的语义分析减少了表型匹配错误率。与KG-COVID等框架相比,该研究首次实现了共病特异性机制挖掘。
这项研究的突破性在于将碎片化的生物医学知识转化为可验证的共病假说网络。不仅证实了COVID-19可通过免疫失调加速神经退行性进程,还发现TRPV4离子通道等新型靶点。构建的公开数据库(https://github.com/SCAI-BIO/covid-NDD-comorbidity-NLP)为后续研究提供平台,其方法论框架也可拓展至其他复杂疾病共病研究。尽管当前结论需进一步实验验证,但这项工作为理解病毒感染与神经退行性变的因果关系迈出关键一步,并为高风险患者的精准干预提供理论依据。
生物通微信公众号
知名企业招聘