基于图结构与预训练模型的药物-靶标相互作用预测新方法GS-DTI及其在阿尔茨海默病药物发现中的应用

【字体: 时间:2025年08月11日 来源:Bioinformatics 5.4

编辑推荐:

  本研究针对药物-靶标相互作用(DTI)预测中存在的泛化性不足和可解释性差等关键问题,开发了整合分子图变换器(KPGT)和蛋白质语言模型(ESM-2/ESMFold)的图结构感知框架GS-DTI。该模型通过结合药物分子图拓扑特征和蛋白质三级结构信息,采用对比学习策略,在跨域测试中MCC指标提升超10%,并能准确定位靶标结合口袋,成功筛选出BACE1新型抑制剂,为阿尔茨海默病等疾病的药物研发提供了高效计算工具。

  

在药物研发领域,准确预测药物与靶标蛋白的相互作用(Drug-Target Interaction, DTI)始终是核心挑战。传统实验方法耗时耗力,而现有计算方法面临"冷启动"困境——当遇到训练数据中未出现的新药物或新靶标时,预测性能急剧下降。更棘手的是,这些模型往往像"黑箱"般运作,无法解释其预测依据,让科研人员难以信任其筛选结果。这种困境在阿尔茨海默病关键靶点BACE1等重要靶点的药物开发中尤为突出。

香港中文大学计算机科学与工程系的研究团队在《Bioinformatics》发表的研究中,提出了革命性的解决方案GS-DTI。该框架创新性地融合了分子图变换器(KPGT)和蛋白质语言模型(ESM-2),并引入蛋白质预测结构(ESMFold)构建接触图谱,通过图多集变换器(GMT)实现特征聚合,配合设计的对比学习策略,显著提升了模型对未知药物-靶标对的预测能力。研究显示,该模型不仅能准确预测相互作用,还可可视化展示靶标蛋白的关键结合残基,为药物设计提供直观指导。

关键技术包括:1) 从SMILES字符串构建分子图并用KPGT提取特征;2) 使用ESMFold预测蛋白质3D结构并生成接触图谱构建蛋白质图;3) 采用包含焦点损失和对比学习的多任务损失函数;4) 在BindingDB(33,238负样本/8,846正样本)和Davis等数据集上进行严格验证。研究团队特别设计了药物冷启动、靶标冷启动和双冷启动三种测试场景,全面评估模型泛化能力。

【GS-DTI在跨域测试中表现卓越】

在最具挑战性的药物-靶标对双冷启动测试中,GS-DTI的Matthews相关系数(MCC)达到0.613,较次优模型提高超10%。可视化分析显示,模型学习到的嵌入空间能清晰区分活性与非活性药物-靶标对,t-SNE降维后形成明显分离簇。

【精准定位靶标结合口袋】

通过梯度加权类激活映射(Grad-CAM)技术,研究证实GS-DTI可识别与实验测定结合口袋高度一致的关键残基。在PDB复合物4HGE和3L7B中,模型预测的重要区域与真实结合位点重合度分别达41.5%和57.1%。

【BACE1抑制剂虚拟筛选成功案例】

在针对阿尔茨海默病靶点BACE1的筛选中,GS-DTI从439个已批准药物中成功找回13/15已知抑制剂(86.7%召回率),并预测出43个高潜力候选药物,其中Doxercalciferol等3个已被文献证实具有BACE1抑制活性。

这项研究突破了DTI预测领域的多个技术瓶颈。首先,通过整合图结构与预训练模型,解决了冷启动难题;其次,创新的可解释性分析方法使模型能"指认"结合位点;最后,在真实药物筛选中验证了实用价值。值得注意的是,研究也坦诚当前局限:依赖Kd值二分类可能丢失亲和力细微差异,未来或需引入多分类框架。该成果为加速抗阿尔茨海默病等疾病的药物发现提供了强大工具,其开源实现(GSDTI)更将推动计算药物研发领域的整体进步。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号