
-
生物通官微
陪你抓住生命科技
跳动的脉搏
FLowDock:基于几何流匹配的蛋白质-配体对接与亲和力预测新方法
【字体: 大 中 小 】 时间:2025年07月16日 来源:Bioinformatics 4.4
编辑推荐:
针对现有生成式AI模型难以同时实现灵活蛋白质-配体对接和亲和力估计的问题,密苏里大学团队开发了首个基于条件流匹配(CFM)的深度几何生成模型FLowDock。该模型可直接将未结合(apo)结构映射到结合(holo)状态,支持多配体并发建模,在PoseBusters基准测试中以51%的盲对接成功率超越单序列AlphaFold 3(AF3),并在CASP16竞赛中跻身亲和力预测前五名,为药物发现提供了高效虚拟筛选工具。
在结构生物学和药物研发领域,准确预测蛋白质与配体的相互作用一直是个重大挑战。传统方法如X射线衍射和冷冻电镜虽然可靠,但耗时耗力且成本高昂。近年来,AlphaFold 3(AF3)等机器学习模型展现出直接从序列预测结构的潜力,但这些模型存在明显局限:无法同时预测复合物结构和结合亲和力,难以处理多配体系统,且缺乏对预测轨迹的生物学解释。更关键的是,现有方法在药理学相关靶点的泛化能力尚未得到充分验证,严重制约了其在药物发现中的应用。
针对这些瓶颈,美国密苏里大学哥伦比亚分校(University of Missouri-Columbia)电气工程与计算机科学系的Alex Morehead和Jianlin Cheng团队开发了FLowDock——首个基于条件流匹配(Conditional Flow Matching, CFM)的深度几何生成模型。这项发表在《Bioinformatics》的研究通过创新的流匹配框架,实现了从非结合态到结合态的直接映射,支持任意数量配体的并发建模,并能同步输出结构置信度评分和结合亲和力值。
研究团队采用了三项核心技术:1) 结合ESMFold预测的蛋白质先验分布与基于配体键图的谐波先验分布构建初始结构;2) 在R3流形上建立条件流匹配目标函数,通过40步VD-ODE求解器实现快速结构生成;3) 开发广义非平衡流匹配策略,使用TM-score≥0.7和RMSD≤5?的过滤标准优化训练数据采样。实验使用的PDBBind-E数据集包含64,310个经过ESMFold结构预测和配体中心对齐的蛋白-配体复合物。
4.1 蛋白质-配体对接性能
在包含308个复合物的PoseBusters基准测试中,FLowDock以51%的成功率(RMSD≤2?且化学有效)超越单序列AF3(41%),仅次于计算资源消耗高10倍的Chai-1。值得注意的是,FLowDock仅需1周8块H100 GPU的训练成本,较Chai-1的128块A100 GPU训练1个月大幅降低。如图2所示,FLowDock的构象修改主要针对初始错误结合口袋,而DynamicBind等基线方法常会破坏AF3已预测正确的口袋结构。

4.2 结合亲和力预测
在PDBBind测试集上,FLowDock的Pearson相关系数达0.705,超越DynamicBind(0.665)等基线(表2)。其预测速度优势显著,单复合物平均耗时39秒,比DynamicBind快3倍。如图6所示,FLowDock能准确预测6I67复合物中蛋白质环域向右移动的关键构象变化,而DynamicBind则出现明显偏差。

4.3 CASP16竞赛验证
在CASP16配体预测类别中,FLowDock成为唯一进入亲和力预测前五的混合模型(结构+亲和力),如图7所示。通过结合前5预测结构的置信度排序,该方法在140个药理学相关复合物上展现出卓越的虚拟筛选潜力。

该研究标志着蛋白质-配体相互作用建模的重要突破。FLowDock不仅解决了现有生成模型无法兼顾多配体对接与亲和力预测的难题,其开源的MIT许可证实现更为生物医学研究提供了实用工具。未来通过扩大训练数据多样性(如PLINDER数据集)和探索ODE求解器优化,有望进一步提升模型在新型结合口袋上的泛化能力。这项工作为加速药物发现进程提供了新的计算范式,使研究人员能够快速筛选具有潜在治疗价值的分子化合物。
生物通微信公众号
知名企业招聘