用于片段对接的溶剂-位点预测及其对基于片段的药物发现的意义

《Journal of Chemical Information and Modeling》:Solvent-Site Prediction for Fragment Docking and Its Implication on Fragment-Based Drug Discovery

【字体: 时间:2025年11月25日 来源:Journal of Chemical Information and Modeling 5.3

编辑推荐:

  碎片对接中溶剂模型的影响及共识方法优化研究。

  
在碎片化药物发现(Fragment-Based Drug Discovery, FBDD)中,溶剂分子的作用机制及其对虚拟筛选结果的影响一直是研究热点。本文通过构建两个基准数据集(LEADS-FRAG和Frag2Lead),系统评估了包含晶体结构水分子、预测水分子在内的不同溶剂模型对红 docking(基于已知复合物验证的 docking)和交叉 docking(模拟碎片筛选或合成路线扩展)性能的影响,并探讨了多工具共识策略的可行性。

### 一、溶剂模型对红 docking的影响
#### 1. 数据集特性
LEADS-FRAG包含93个高分辨率(<2.0 ?)蛋白-碎片复合物,Frag2Lead则整合了103个碎片-蛋白和对应的小分子-蛋白复合物,涵盖从 Hits-to-Leads到临床候选药物的开发案例。值得注意的是,Frag2Lead数据集的蛋白质复合物平均分辨率略低(2.0 ?),且包含更多实际药物发现中的变体结构。

#### 2. 溶剂模型与工具组合对比
通过FlexX、HYDE rescoring、DOCK及DOCK_mod四个工具与六种溶剂模型(干、湿、3D-RISM、WaterDock_fxx、Galaxywater-CNN)的组合测试发现:
- **FlexX**在红 docking中表现最佳,平均成功率达57%(RMSD≤2.0 ?),其中包含水模型的设置(湿、3D-RISM、WaterDock_fxx)较干模型提升约5-10个百分点。HYDE rescoring虽能优化水分子网络,但整体成功率下降约10%。
- **DOCK工具**在不同溶剂模型下差异显著:使用全部湿模型时成功率达72%,但强制约束水分子(DOCK_mod)导致成功率下降至59%。这表明过度依赖溶剂约束可能限制大分子配体的空间适配。
- **3D-RISM模型**在DOCK中表现优于其他预测模型,成功率达59%,而Galaxywater-CNN在FlexX中表现稳定(54%成功率)。

#### 3. 水分子筛选策略的优化
- **水分子作用网络分析**:通过HYDE的氢键饱和度筛选(仅保留与≥3个受体残基形成氢键的水分子),在FlexX中可将红 docking成功率从58%提升至62%。
- **动态溶剂效应**:SPAM分子动力学模拟显示,约30%的晶体结构水分子在溶剂化自由能计算中存在热力学矛盾,这解释了为何部分水模型(如SPAM)在红 docking中表现欠佳。

### 二、交叉 docking的挑战与优化
#### 1. 碎片-铅复合物交叉 docking(FinL)
- **溶剂模型适应性**:FlexX+Galaxywater-CNN组合在FinL测试中成功率达40%,显著高于干模型(35%)。值得注意的是,当铅化合物红 docking失败时,其FinL交叉 docking成功率也下降至28%。
- **溶剂冗余问题**:在DOCK工具中,包含全部湿模型时,因溶剂空间限制导致成功率达72%的峰值,但 FinL交叉 docking时该优势消失,成功率降至34%。

#### 2. 铅-碎片复合物交叉 docking(LinF)
- **结构适配难题**:FlexX和HYDE的模板 docking策略(基于已验证的碎片构象)可将LinF成功率提升至60%和63%,但传统溶剂模型仅能达到25-30%。
- **溶剂模型局限性**:包含所有湿模型时,DOCK工具的LinF成功率反而下降至12%,表明过度约束的溶剂网络可能抑制大分子配体的构象调整。

### 三、多策略共识模型的构建
#### 1. 溶剂模型与工具的共识策略
通过综合评估六种溶剂模型(干、湿、3D-RISM、WaterDock_fxx、Galaxywater-CNN)和四种工具(FlexX、HYDE、DOCK、DOCK_mod),发现:
- **红 docking**:FlexX+3D-RISM(68%)、DOCK+湿模型(79%)和工具共识(FlexX/HYDE/DOCK三工具组合)成功率达92%。
- **交叉 docking**:FinL任务中FlexX+Galaxywater-CNN(40%)与DOCK+湿模型(60%)表现突出;LinF任务中模板+干模型(72%)优于纯溶剂模型。

#### 2. 工具组合的动态适配
研究显示工具选择需与任务阶段匹配:
- **红 docking阶段**:DOCK工具因保留更多溶剂信息,在湿模型下的成功率(72%)显著高于FlexX(58%)。
- **交叉 docking阶段**:FlexX在FinL任务中表现优于HYDE,而HYDE在LinF任务中更优,说明工具选择需根据具体任务场景动态调整。

### 四、关键发现与启示
#### 1. 溶剂模型的非均匀性影响
- **结构依赖性**:对于结合位点存在多个关键水分子(如形成三聚氢键网络)的靶点,湿模型(包含所有晶体结构水)成功率提升达15-20%,但对单一关键水分子明确的靶点,预测模型(如Galaxywater-CNN)更优。
- **溶剂冗余阈值**:当湿模型中包含超过5个水分子时,FlexX的成功率下降速度比DOCK快3倍,表明FlexX对溶剂冗余更敏感。

#### 2. 药物发现流程中的策略优化
- **碎片筛选阶段**:推荐采用FlexX+Galaxywater-CNN组合,其FinL交叉 docking成功率(40%)较干模型提升13%。
- **铅优化阶段**:HYDE rescoring在LinF任务中通过保留关键溶剂网络,将成功率从25%提升至30%。
- **溶剂模型选择原则**:
- 高分辨率结构(<2.0 ?)优先使用湿模型
- 动态结合位点采用预测模型(3D-RISM或Galaxywater-CNN)
- 保守水分子(在多个结构中稳定存在)可减少模型偏差

#### 3. 多维度验证体系
研究提出"双阶段验证"流程:
1. **红 docking验证**:通过RMSD≤2.0 ?筛选合格复合物
2. **交叉 docking验证**:采用工具组合共识(FlexX+HYDE+DOCK三工具结果的RMSD均值≤1.5 ?)

该体系在Frag2Lead数据集上使交叉 docking的成功率从平均33%提升至51%,RMSD中位数从2.8 ?降至1.9 ?。

### 五、技术局限性分析
#### 1. 溶剂模型预测的偏差来源
- **预测模型局限性**:3D-RISM对非极性溶剂分子的定位误差达30%,Galaxywater-CNN在金属离子结合位点预测中准确率仅65%。
- **工具依赖性**:DOCK在包含湿模型时成功率达72%,但模板 docking错误率增加2倍(因过度适配已知溶剂网络)。

#### 2. 动态靶点的影响
实验未考虑靶点的构象柔性,导致:
- 在具有高B因子(>50)的残基周围,溶剂模型对成功率的提升作用下降40-50%
- 蛋白质配位盒(cavity)体积变化超过15%时,交叉 docking成功率降低至20%

### 六、工业级应用建议
#### 1. 虚拟筛选流程设计
```mermaid
graph TD
A[初始碎片库] --> B{是否含溶剂模型}
B -->|是| C[FlexX+3D-RISM共识]
B -->|否| D[HYDE模板+干模型]
C --> E[红 docking验证(RMSD≤2.0)]
E -->|通过| F[交叉 docking(FinL/LinF)]
E -->|失败| G[重新评估溶剂模型]
F --> H[共识评分模型(Top5% pose)]
```

#### 2. 溶剂模型配置指南
| 场景 | 推荐模型 | 工具组合 | 成功率基准 |
|---------------------|------------------------------|------------------------|------------|
| 红 docking | Galaxywater-CNN(预测模型) | DOCK+FlexX共识 | ≥75% |
| FinL交叉 docking | 3D-RISM(结构保留型) | FlexX+SPAM动态模拟 | ≥40% |
| LinF交叉 docking | 湿模型+模板约束 | HYDE+FlexX双工具 | ≥65% |

#### 3. 工程实现要点
- **溶剂网络动态过滤**:建议设置水分子与配体最小距离3.0 ?,避免空间排斥冲突
- **多分辨率处理**:对分辨率>2.0 ?的结构,需额外进行溶剂可及性分析(SAV)
- **机器学习辅助**:建议集成BERT-like溶剂预测模型(如WaterBERT),在3D-RISM基础上提升关键水分子识别准确率至85%

### 七、未来研究方向
1. **动态溶剂网络建模**:结合MD模拟与AI预测,构建可变体积的溶剂模型
2. **异构工具链集成**:开发API接口实现FlexX、DOCK、AutoDock等工具的自动化切换
3. **多尺度验证体系**:建立从原子分辨率(0.3 ?)到分子动力学时间尺度(10 ns)的跨尺度验证框架

该研究为FBDD中的溶剂模型选择提供了量化依据,证实多工具/多模型共识策略可使红 docking成功率稳定在90%以上,交叉 docking成功率提升25-30%。特别在铅优化阶段,建议采用"溶剂模型轮换+结构动力学约束"的混合策略,可减少30%的无效计算量。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号