
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于诱导契合理论的ColdstartCPI模型:提升药物-靶标相互作用预测的泛化性能
【字体: 大 中 小 】 时间:2025年07月12日 来源:Nature Communications 14.7
编辑推荐:
研究人员针对传统药物-靶标相互作用(CPI)预测方法在新型化合物和蛋白质预测中的局限性,开发了基于诱导契合理论的ColdstartCPI框架。该模型通过无监督预训练特征和Transformer模块学习化合物与蛋白质的柔性结合特性,在BindingDB等三大基准数据集上AUC达0.970±0.001,显著优于现有方法。研究通过分子对接和自由能计算验证了模型在阿尔茨海默病等疾病治疗中的预测准确性,为基于序列的药物设计提供了新思路。
在药物发现领域,准确预测化合物与蛋白质的相互作用(CPI)至关重要,但传统基于"锁钥理论"的刚性对接方法难以应对分子灵活性和数据稀疏性的挑战。尤其面对新型化合物和蛋白质时,现有模型的预测性能显著下降,这严重制约了新药研发效率。针对这一瓶颈问题,中南大学的研究团队在《Nature Communications》发表了突破性研究成果。
研究团队创新性地提出ColdstartCPI框架,该模型首次将生物化学中的诱导契合理论引入CPI预测领域。通过整合Mol2Vec和ProtTrans的无监督预训练特征,结合Transformer模块的动态交互学习能力,使模型能够模拟蛋白质与化合物结合时的构象变化。关键技术包括:1)基于大规模化合物库和蛋白质序列的无监督预训练特征提取;2)通过Decouple模块实现特征空间解耦;3)利用Transformer捕捉分子间/内相互作用;4)采用BindingDB等三大基准数据集进行四类场景(常规启动/三种冷启动)验证;5)通过分子对接和MM-PBSA自由能计算进行生物学验证。
研究结果部分显示:

虚拟筛选能力:在DUD-E基准测试中,ColdstartCPI的EF0.5%达到21.61,显著优于PLANET(10.23)等深度学习方法,证明其在早期药物筛选中可高效富集活性分子。
稀缺数据表现:在95%数据缺失的极端条件下,模型仍保持0.833±0.007的AUC,展现强大鲁棒性。
案例验证:针对阿尔茨海默病靶点乙酰胆碱酯酶(P22303),模型预测的49个Top100化合物均获文献支持,其中CNP0450629的结合自由能(-7.55 kcal/mol)优于已知配体E20(-5.24 kcal/mol)。

该研究通过系统实验证实,ColdstartCPI能更准确地模拟蛋白质-配体结合时的构象变化,其蛋白特征相似度(均值0.686)显著低于传统交叉注意力模型(均值0.999)。特别是在柔性结合数据集(FlexibleBind)上,模型展现出对诱导契合相互作用的特异性识别能力(p<10-14)。研究不仅提供了高效的CPI预测工具,更通过引入生物物理理论深化了对分子识别机制的理解,为基于人工智能的药物设计开辟了新途径。未来整合多模态预训练模型和结合位点信息,有望进一步提升预测精度和可解释性。
生物通微信公众号
知名企业招聘