NanoBinder:基于Rosetta能量评分与机器学习融合的纳米抗体结合预测新工具

【字体: 时间:2025年06月17日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  本研究针对纳米抗体(Nanobody, NB)设计过程中传统Rosetta协议假阴性率高、实验验证成本高昂的问题,开发了机器学习辅助工具NanoBinder。该模型通过整合Rosetta能量评分与随机森林(Random Forest, RF)算法,显著提升了NB-AG(纳米抗体-抗原)结合预测的准确性(MCC=0.8203),实验验证显示其对非结合体的过滤准确率达100%。研究为加速纳米抗体药物研发提供了高效计算筛选方案,成果发表于《Journal of Cheminformatics》。

  

在生物医药领域,纳米抗体因其体积小、稳定性高和穿透性强等优势,成为新一代治疗性抗体的研究热点。然而,传统计算设计工具如Rosetta存在显著局限——尽管其RosettaAntibodyDesign协议能生成大量候选结构,但假阴性率高达90%以上,迫使研究者必须通过耗时的酵母表面展示(Yeast Surface Display)或生物层干涉术(Bio-Layer Interferometry, BLI)等实验手段筛选数千个候选分子。这种"大海捞针"式的筛选不仅耗费数百万美元成本,更严重延缓了药物开发进程。

针对这一瓶颈,韩国生命工学研究院与全北国立大学的研究团队创新性地将机器学习与物理建模相结合,开发出NanoBinder预测系统。该研究通过分析3966个经实验验证的NB-AG复合物(其中2570个非结合复合物通过独创的基于RMSD的结构对齐策略构建),从Rosetta输出的40个能量评分中筛选出26个关键特征,包括界面自由能(dGcross
)、溶剂可及表面积变化(dSASA)和氢键网络(hbonds_int)等。研究团队特别发现"dGcross
/dSASAx100"是区分结合活性的最关键指标,通过SHAP分析揭示该参数与结合概率呈显著负相关。

关键技术方法包括:1) 从SAbDab数据库获取1396个阳性复合物,通过结构对齐生成2570个阴性样本;2) 采用RosettaAntibody协议计算40种能量特征,经Pearson相关性分析降维至26维;3) 构建包含SMOTETomek过采样的分层五折交叉验证框架,优化后的随机森林模型在测试集展现0.9185准确率;4) 通过酵母展示和FACS对49个设计纳米抗体进行功能验证。

NanoBinder utilizes Rosetta energy scores to predict nanobody-antigen interactions
研究团队建立了一套端到端预测流程:首先通过RosettaAntibody设计协议提取复合物能量特征,随后利用随机森林模型预测结合概率。特征选择阶段发现,界面自由能标准化参数(dGcross
/dSASAx100)与氢键数量(hbonds_int)对模型贡献度最高,这与纳米抗体结合依赖紧密界面相互作用的生物学特性高度一致。

NanoBinder demonstrates consistent performance in cross-validation analysis
在五折交叉验证中,优化后的RF模型全面超越其他算法,马修斯相关系数(MCC)达0.8203,精确召回曲线下面积(PRC)为0.8253。特别值得注意的是,模型对非结合体的识别准确率高达100%,而传统方法GDockScore在此项测试中仅获得43.75%准确率。

SHAP analysis reveals key features influencing nanobinder's binding predictions
通过SHAP蜜蜂群图解析发现,低dGcross
值(强负值)和高氢键密度是预测结合的关键因素。有趣的是,侧链堆积参数(side1_normalized)呈现双峰分布——适度优化可增强结合,但过度包装反而导致假阳性,这一发现为后续抗体工程提供了重要设计准则。

Experimental validation reveals NanoBinder's efficacy
在三组实验验证中,NanoBinder展现出差异化性能:对于结构高度相似的IL-6靶向纳米抗体(Set 1),模型准确率为71%;而在序列多样性更高的Set 2(针对5个不同表位)中,准确率提升至80%。值得注意的是,所有被预测为"非结合"(概率<0.5)的候选体均经FACS验证无活性,证实了模型在早期筛选中的可靠性。

这项研究的意义在于:首次将Rosetta的物理能量函数与机器学习有机结合,解决了纳米抗体设计中的"高假阴性"难题。相比需要9000次实验筛选的传统方法,NanoBinder可将验证规模缩减90%以上。尽管模型对亲和力细微差异的敏感性有待提升(如SKEMPI数据库突变体预测),但其强大的非结合体过滤能力已显著降低研发成本。该工具已部署为开源网络服务器,为全球科研人员提供免费访问。未来通过整合AlphaFold3等新型结构预测算法,有望进一步拓展其在全原子设计中的应用前景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号