
-
生物通官微
陪你抓住生命科技
跳动的脉搏
HEDDI-Net:基于异质网络嵌入的药物-疾病关联预测与老药新用研究——以阿尔茨海默病为例
【字体: 大 中 小 】 时间:2025年02月10日 来源:Journal of Translational Medicine 6.1
编辑推荐:
本研究针对传统药物研发周期长、成功率低的瓶颈,开发了HEDDI-Net异质网络嵌入架构,通过整合蛋白质-药物亲和力模型与疾病语义相似性网络,实现了药物-疾病关联的精准预测(AUC>0.98)。该模型突破现有图神经网络需重新训练的局限,可直接应用于新疾病/药物预测,并在阿尔茨海默病案例中验证了40%预测药物已进入临床试验,为加速药物重定位(drug repurposing)提供了可解释的AI工具。
在药物研发领域,开发一个新药平均需要耗费26亿美元和10-15年时间,但最终获批率不足10%。面对这一"高投入、高风险"困局,老药新用(drug repurposing)因其安全性明确、开发周期短的优势,成为突破性解决方案。然而,现有基于图神经网络(GCN)的预测方法存在两大痛点:一是仅能预测已知药物和疾病的关联,遇到新实体需重新训练网络;二是模型可解释性差,难以阐明药物作用的生物学机制。
国立阳明交通大学(原National Yang Ming Chiao Tung University)的研究团队在《Journal of Translational Medicine》发表创新成果,提出HEDDI-Net异质网络嵌入架构。该研究通过支持向量回归(SVR)构建228个代表蛋白质的亲和力模型,结合基于医学主题词(MeSH)的277个代表疾病语义网络,开发出可同时实现高精度预测(AUC>0.98)和机制解释的深度学习框架。关键技术包括:1) 从BindingDB数据库获取118,366个小分子化合物的结合亲和力数据;2) 采用Wang算法计算4,933种疾病的语义相似性;3) 构建多层感知器(MLP)整合异质特征预测关联概率。
HEDDI-Net架构:融合浅层学习与图论的创新设计
研究团队设计了三模块工作流:蛋白质-药物亲和力模型预测药物与代表蛋白的结合强度,疾病相似性模型通过MeSH层级结构计算疾病间语义关系,关联学习模型则通过MLP整合上述特征。与现有方法相比,该架构在18,416个已知关联的测试集上AUPR值提升显著,且无需重新训练即可预测新实体。
卓越的预测性能与稳健性验证
十折交叉验证显示,模型在71,187个直接证据关联和26,789个治疗关联数据集上AUC均超过0.98。系统性去除Top100疾病关联的恢复实验显示73%的中位恢复率,显著优于DRHGCN等对比方法。这种"即插即用"特性使其在真实场景中具备独特优势。
阿尔茨海默病的转化医学验证
在案例研究中,模型预测的58个候选药物中,42%已进入临床试验(如巴氯芬、氟西汀)。通过分析药物与代表蛋白(如ITGB3、CAPN2)的相互作用,阐明其可能通过调节神经炎症(如抑制小胶质细胞活化)或减少tau蛋白过度磷酸化等机制发挥作用。
这项研究开创性地解决了药物重定位领域的核心挑战:在保持深度学习预测精度的同时,通过代表蛋白和疾病特征实现机制解释。HEDDI-Net可直接输出候选药物的靶蛋白亲和模式,为设计类似药物提供分子蓝图。特别值得注意的是,该模型对阿尔茨海默病的成功预测验证了其在神经退行性疾病领域的应用潜力,其开源特性(代码将发布于GitHub)更将推动个性化药物发现的新范式发展。
生物通微信公众号
知名企业招聘