基于神经迭代筛选?扩展(Neural Iterative Selection?Expansion, NISE)的零样本小分子药物结合蛋白从头设计

《Nature》:Zero-shot design of drug-binding proteins via neural iterative selection?expansion

【字体: 时间:2026年06月25日 来源:Nature 56.1

编辑推荐:

  摘要:小分子结合蛋白的从头设计一直具有挑战性,因为这需要同时优化蛋白质序列、蛋白质结构及配体构象。现有深度学习算法难以在此景观中导航,阻碍了结合蛋白的零样本(zero-shot)设计。本研究通过将两个神经网络组合于迭代设计算法中,实现了从小分子结合蛋白的从头高

  
摘要:小分子结合蛋白的从头设计一直具有挑战性,因为这需要同时优化蛋白质序列、蛋白质结构及配体构象。现有深度学习算法难以在此景观中导航,阻碍了结合蛋白的零样本(zero-shot)设计。本研究通过将两个神经网络组合于迭代设计算法中,实现了从小分子结合蛋白的从头高精度创建。研究人员训练了一个图神经网络——配体感知序列工程消息传递神经网络(Ligand-Aware Sequence Engineering Message-Passing Neural Network, LASErMPNN)——为输入的蛋白质骨架和对接配体设计兼容的蛋白质序列。研究人员将LASErMPNN与一个可基于输入蛋白质序列和配体身份对三维蛋白质?配体复合物进行建模的结构预测器配对。这两个互逆网络的闭环迭代优化了序列?结构?配体兼容性,且优于使用基于物理能量函数的可比设计循环。研究人员采用该策略(称为神经迭代筛选?扩展,Neural Iterative Selection?Expansion, NISE)设计了使用不同折叠、特异性结合两种化学迥异的小分子药物——艾沙替康(exatecan)和阿哌沙班(apixaban)——的蛋白质,成功率分别为100%和83%。最紧的NISE结合蛋白具有纳摩尔至皮摩尔级亲和力,分别比次优方法高出70倍(exatecan)和近10,000倍(apixaban)。LASErMPNN随后建议了两个氨基酸替换,使最紧exatecan结合蛋白的亲和力在无任何实验输入的情况下提高了100倍。优化后的结合蛋白使exatecan易水解的内酯环在数天内免受水解。本工作描述了一种利用神经网络自动化设计小分子结合蛋白的通用方案,可应用于药物递送、传感及催化领域。
论文解读:基于神经迭代筛选?扩展(NISE)的零样本小分子药物结合蛋白从头设计
《Nature》刊载的此项研究针对小分子结合蛋白从头设计中需同步优化序列、结构与配体构象的难题,指出现有深度学习方法无法有效导航此复杂景观,导致零样本设计难以实现。研究人员提出神经迭代筛选?扩展(Neural Iterative Selection?Expansion, NISE)算法,耦合配体感知序列设计网络LASErMPNN与全原子蛋白质?配体共结构预测器(RoseTTAFold All-Atom或Boltz-2),通过交替采样条件概率分布P(seq|struct,lig)与P(struct,lig|seq),在联合概率分布P(seq,struct,lig)中爬升至高概率模式,实现对四螺旋束(结合exatecan)及NTF2折叠(结合apixaban)的高成功率、高亲和力设计,并验证其对内酯环的水解保护功能及神经校对(neural proofreading)提升亲和力的能力。
主要关键技术方法:
研究人员首先通过家族范围幻觉(family-wide hallucination)与RFdiffusion生成可设计四螺旋束及选取已知NTF2骨架,用COMBS或刚体对接获得配体初始姿态。核心技术含:(1)训练配体感知序列工程消息传递神经网络(LASErMPNN)——异构图网络含预训练配体编码器,联合自回归解码残基身份与侧链二面角χ1-4,学习P(seq|backbone,lig);(2)采用RoseTTAFold All-Atom(RFAA)或Boltz-2预测P(struct,lig|seq)及配体pLDDT;(3)NISE迭代循环:以骨架+对接配体为初值→LASErMPNN高温采样设计序列→RFAA/Boltz-2预测共结构→筛选高配体pLDDT且骨架/配体低RMSD的设计作为下一轮输入→重复至收敛;(4)神经校对:用LASErMPNN对结合口袋残基单点扫描降低负对数似然(NLL)提出突变;(5)实验验证含荧光偏振法测Kd、尺寸排阻色谱(SEC)检测单体性、X射线晶体学确证结构、紫外吸收动力学监测exatecan内酯环水解。
NISE sampling algorithm(NISE采样算法)
研究人员阐述NISE原理类比坐标上升法,交替从P(seq|struct,lig)广域采样与取P(struct,lig|seq)中高置信度argmax,避免局部极小并通过高softmax温度鼓励探索。筛选标准为骨架Cα RMSD与配体重原子RMSD均低且配体pLDDT高,选前几名进入下一轮。相比用Rosetta能量最小化替代结构预测器的基于能量迭代选择?扩展(energy-based ISE),NISE同时优化配体pLDDT与序列NLL(负对数似然),证明双神经网络协同必要。
LASErMPNN neural network(LASErMPNN神经网络)
研究人员基于PDB蛋白?配体共晶结构训练LASErMPNN异构图网络,配体节点来自预训练量子化学性质预测编码器(预测部分电荷等)。与LigandMPNN相比,LASErMPNN含独立可预训练配体编码器、联合解码残基类型与侧链二面角、每轮编码均含配体节点,且对骨架帧整体加噪以减少晶体 artifact记忆。严格留一(streptavidin及PiB/rucaparib复合物)验证显示LASErMPNN结合位点序列恢复率优于LigandMPNN,RFAA/Boltz-1预测自洽结构成功率更高,且不易出现过密包埋(overpacking)。LASErMPNN可为新配体输出预测部分电荷作诊断。
Exatecan design objective(Exatecan设计目标)
研究人员选择拓扑异构酶I抑制剂exatecan(喜树碱类)为靶标,其具pH敏感易水解内酯环(半衰期~2 h),开环羧酸形式活性低且被人血清白蛋白(HSA)结合。设计目标为构建能包埋内酯环、阻止水解并特异性结合exatecan的小型蛋白,可用于ADC载荷保护或游离药物清除。PDB中无exatecan结构,增加设计难度。
Design of exatecan binders using NISE(用NISE设计Exatecan结合蛋白)
研究人员由40个高pLDDT四螺旋束经COMBS对接exatecan构象获初始姿态,取COMBS-Rosetta最优设计去序列作NISE输入。NISE运行35轮后设计物在骨架自洽性基础上显著提升配体正确取向自洽性。筛选出4个设计(平均成对序列相似40%),NISE改变原结合位点残基、将310螺旋重塑为典型α螺旋、缩窄螺旋界面增强超卷曲、使配体更深埋入疏水核。实验合成并表达4个设计,全部为单体且结合exatecan(Kd=0.12 μM~17 μM),最佳命名为EPIC(exatecan–protein interaction construct,Kd=120 nM),较COMBS法最优(Kd=8 μM)强约70倍,较HSA(Kd=43 μM)强约360倍。COMBS法16个设计中仅3个结合。NISE成功归因于联合优化序列?结构?配体而非仅过滤。
Characterization of exatecan binders(Exatecan结合蛋白表征)
荧光偏振证实EPIC具camptothecin类选择性(FL118 Kd=6 μM、belotecan 19 μM、camptothecin 90 μM),不结合irinotecan(位阻排斥)及其他类药物(apixaban、dexamethasone)。热稳定性良好。NISE轨迹中非靶配体(camptothecin)配体pLDDT持续低,exatecan配体pLDDT逐轮升高,与实验特异性吻合。
Neural proofreading of the EPIC sequence(EPIC序列的神经校对)
研究人员用Amber弛豫后RFAA预测结构作LASErMPNN输入,对EPIC结合口袋残基逐点计算NLL建议突变。Q51N与M97L单位点分别使Kd降至8.0 nM与7.4 nM,双突变EPIC(Q51N/M97L) Kd=1.2 nM(提高100倍),且突变体均保持单体。X射线晶体学(EPIC 2.0 ?;EPIC(Q51N) 2.2 ?)证实设计模式:Asp132接受exatecan胺基氢键,Gln51/Asn51给内酯羟基氢键;Asn51较短侧链使exatecan更深埋并形成双氢键,解释亲和力提升。设计骨架Cα RMSD对模型仅0.8 ?,配体重原子位移<1 ?。
Crystal structures of EPIC and EPIC(Q51N)(EPIC及EPIC(Q51N)晶体结构)
晶体结构验证设计准确性:配体结合模式与预测一致(δ-内酯处RFAA稍偏差但Boltz-1/AF3更准),结合口袋残基rotamer被LASErMPNN准确预测。EPIC(Q51N)中Asn51与exatecan内酯羰基及羟基形成双氢键,配体进一步去溶剂化深埋。EPIC与拓扑异构酶I无同源性,证明NISE产生全新结合方案。
EPIC protects exatecan from hydrolysis(EPIC保护Exatecan免于水解)
时间分辨吸收光谱显示:PBS pH 7.4中游离exatecan 6 h内基本开环(~85%羧酸盐);EPIC或EPIC(Q51N/M97L)结合后>99%维持内酯环闭合达50 h以上,甚至在500 μM HSA共存下仍保护。HSA结合不能阻止开环。EPIC通过疏水包埋内酯环改变平衡朝向生物活性闭环形式,具药物递送应用潜力。
Design of apixaban binders using NISE(用NISE设计Apixaban结合蛋白)
为验证普适性,研究人员选用NTF2折叠与抗凝药apixaban(因子Xa抑制剂)。用Boltz-2替代RFAA作共结构预测器,刚体对接apixaban入50个NTF2骨架,初筛后对有希望姿态运行NISE(14~28轮),按配体pLDDT与Boltz-2结合概率P(bind)线性组合排名。选6个设计表达纯化,5/6结合apixaban(Kd<50 nM),最佳APEX(apixaban-binding protein exemplar) Kd=80 pM(与天然靶点factor Xa Ki相当),不结合exatecan。此前LigandMPNN+Rosetta法同骨架成功率仅约0.04%(4/9024),最好Kd=680 nM。NISE成功率83%、亲和力提高近10,000倍,证明算法不依赖特定折叠及不需专用对接方法。
Discussion(讨论)
研究人员总结:NISE通过两互逆生成网络紧密耦合实现小分子结合蛋白零样本设计——一网络广域采样序列空间,另一网络建模蛋白?配体坐标联动变化。对比基于Rosetta能量的ISE失效,说明经验性能量函数梯度偏离联合分布梯度,而NISE直接沿习得分布爬升。NISE先宽搜后深搜,全神经网络闭环优化,不依赖特定网络版本(可用更优模型替代)。仅正向设计(针对靶配体塑形口袋)即获高特异性;可引入负设计强化选择性。研究表明现代深度神经网络可从PDB数据捕获蛋白?配体识别复杂性,NISE类算法使定制蛋白作为生物操纵试剂成为可能。该工作发表于《Nature》。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号