计算设计序列特异性DNA结合蛋白:从纳米级亲和力到细胞功能调控的新突破

【字体: 时间:2025年09月13日 来源:Nature Structural & Molecular Biology 10.1

编辑推荐:

  为解决基因编辑与调控中DNA结合蛋白(DBPs)设计难题,研究人员开发了计算设计方法,成功生成靶向任意DNA序列的小型DBPs,实现纳摩尔级亲和力与高特异性,并在原核和真核细胞中验证其转录调控功能,为合成生物学和基因治疗提供了新型可编程工具。

  

在生物学和生物技术领域,序列特异性DNA结合蛋白(DBPs)扮演着至关重要的角色,它们如同基因世界的“精准导航系统”,能够识别并结合特定的DNA序列,从而调控基因表达、进行基因组编辑等。然而,尽管科学家们已经通过筛选方法在重编程天然DBPs方面取得了一些进展,但计算设计能够识别任意靶点序列的新型DBPs仍然是一个巨大的挑战。天然蛋白的骨架几何形状限制了可识别的靶序列范围,而像锌指蛋白(ZF)、转录激活因子样效应物(TALE)和CRISPR-Cas系统等现有工具,虽然在基因编辑中表现出强大功能,但也存在诸如工程化繁琐、尺寸过大不利于递送、需要额外的向导RNA以及靶点序列受原间隔序列相邻基序(PAM)限制等问题。因此,开发一种通用的、能够计算设计小型、高特异性、易于递送的DBPs的方法,对于基因调控和编辑应用具有迫切的需求和深远的意义。

为了突破这一瓶颈,由Cameron J. Glasscock、Robert J. Pecoraro和Ryan McHugh等人领导的研究团队在《Nature Structural & Molecular Biology》上发表了一项开创性研究。他们开发了一种计算设计方法,能够生成靶向短特异性序列的小型DBPs,这些设计出的蛋白通过与大沟中的碱基相互作用,对五个不同的DNA靶标表现出纳摩尔级的高亲和力。单个结合模块的特异性与计算模型在多达六个碱基对位置上高度匹配,并且通过使用RF diffusion(一种蛋白质结构生成方法)刚性定位结合模块,可以实现更高阶的特异性。一个设计的DBP-靶点复合物的晶体结构与设计模型高度一致,并且这些设计的DBPs能够在大肠杆菌和哺乳动物细胞中有效抑制和激活邻近基因的转录。这项研究为基因调控和编辑提供了一条通往小型化、易于递送的序列特异性DBPs的新途径。

研究人员为开展此项研究,主要运用了以下几个关键技术方法:1) 利用宏基因组序列数据和AlphaFold2(AF2)结构预测构建了包含约26,000个螺旋-转角-螺旋(HTH)骨架的库;2) 扩展了RIFdock方法,将其应用于蛋白质- DNA相互作用,以精细采样大量可能的对接方式,寻找能形成有利相互作用的支架放置;3) 采用基于Rosetta或深度学习方法LigandMPNN进行界面序列设计,优化蛋白质与DNA的相互作用;4) 通过酵母表面展示技术和高通量测序进行大规模结合剂筛选和功能验证;5) 利用生物层干涉技术(BLI)体外测定纯化蛋白与DNA的结合亲和力;6) 借助X射线晶体学解析了设计蛋白与DNA的复合物结构,以验证设计准确性。

研究结果部分揭示了该计算设计方法的有效性和广泛适用性。

Design strategy

研究人员首先制定了一套设计原则,以克服DNA序列识别中的三大挑战:精确定位蛋白质骨架以使氨基酸侧链接触DNA碱基;识别特定DNA碱基;以及实现精确的几何侧链放置。他们假设,与磷酸骨架的相互作用(如主链酰胺介导的氢键)可以精确放置设计的支架,从而促使设计用于特异性碱基接触的残基以预期的几何形状相互作用。他们选择HTH DNA结合域作为计算设计的候选对象,因为它体积小、结构紧凑,并且能够通过DNA大沟中的识别螺旋进行直接接触。通过利用宏基因组数据和高精度深度学习结构预测(AlphaFold2),他们生成了一个包含约26,000个HTH支架的库,精细采样了不同的螺旋方向和环几何形状。随后,他们扩展了RIFdock方法,将其应用于蛋白质-DNA相互作用,专注于大沟中核苷酸碱基原子的极性和非极性相互作用,特别是蛋白质侧链-DNA碱基氢键相互作用。为了识别特定DNA碱基,他们使用了基于Rosetta的序列设计或扩展版的深度学习软件LigandMPNN。为了应对第三个挑战,他们通过侧链-侧链氢键实现了界面的预组织,并使用Rosetta Rotamer Boltzmann计算进行评估,选择具有类天然关键接触预组织的设计,以实现特异性DNA结合所需的精度水平。

DBP generation and screening with yeast display cell sorting

研究团队创建了三组设计,分别采用了基于Rosetta的序列设计、LigandMPNN序列设计以及结合了骨架重塑协议的设计策略。针对不同的DNA靶标,他们合成了编码50-65个氨基酸设计蛋白的寡核苷酸池,并将其克隆到酵母表面表达载体中。通过几轮使用荧光标记靶标dsDNA寡核苷酸的荧光激活细胞分选(FACS),富集了与每个细胞靶标结合的设计细胞。对初始分选群体进行深度测序后,他们鉴定出97个设计在与其预期dsDNA靶标分选的池中显著富集(>100倍)。作为单独克隆测试后,发现其中44个具有可检测的结合活性。通过突变与DNA碱基相互作用最广泛的2-3个残基进行敲除实验,完全或基本上破坏了所有在酵母上具有可检测结合的设计的结合,表明功能性设计按预期工作。

Design conformation and

对成功的设计进行深入表征,最终获得了14个高亲和力(30-500 nM)和序列特异性的DBPs(例如DBP 6, 35, 48, 56, 57, 60, 62 和 85),包括针对五个独特DNA序列(序列A-E)的结合剂。酵母展示竞争实验表明,DBP 6, 35, 48, 56 和 62 表现出与设计的侧链-碱基相互作用一致的特异性。例如,DBP 6 对 GCxG 基序具有特异性。通过大肠杆菌表达纯化这些设计蛋白,并利用生物层干涉技术(BLI)评估其与生物素化dsDNA寡核苷酸的结合,发现所有设计均以纳摩尔级的亲和力结合。尽管一些设计靶向了晶体结构中存在的DNA序列,但设计的DBPs及其序列偏好是新颖的,与蛋白质数据库(PDB)中的天然DBP共晶结构比较,发现一些设计具有独特的界面和对接方向,而另一些则结合了PDB或JASPAR非冗余转录结合谱数据库中均未出现的新序列。

Structural validation of DNA binder designs

为了评估设计模型的准确性,研究人员解析了DBP 48与其靶点序列复合物的晶体结构(分辨率为2.34 ?,PDB 8TAC)。整体结构以及关键界面残基(如R38和S39)与设计模型高度一致,形成了预期的侧链-碱基氢键。虽然D43和R49没有形成设计模型中观察到的预期氢键,但它们参与了水介导的氢键网络或与磷酸骨架的相互作用。这些水介导的相互作用虽然未被Rosetta协议考虑,但可能由LigandMPNN训练集隐含地捕捉到,并可能赋予额外的特异性。与DNA磷酸骨架的广泛氢键网络表明,对接方向很大程度上由这些相互作用主导。

Assessment and optimization of designed DBP specificity

通过通用蛋白质结合微阵列(uPBMs)评估了七个设计的特异性,发现几个设计(如DBP 6, 9 和 48)对其设计靶标表现出非常高的特异性。所有设计的正交性分析表明,一些设计是高度特异性的。对于特异性适中的DBP 35,研究人员结合突变扫描中发现的替代,创建了一个优化变体(DBP 35opt),该变体显著提高了结合强度和特异性,并减少了对脱靶基序的结合。

Designed DBPs modulate transcription in living cells

最后,研究测试了设计的DBPs在活细胞中调控转录的能力。在大肠杆菌中,通过将设计的DBPs构建为候选NOT门,发现单个DBP域或通过柔性连接体串联的两个相同DBP未能有效抑制转录。为了增加亲和性和体积,研究人员使用RFdiffusion将两个相同的DBP(或两个不同的DBP)刚性定位在含有两个回文拷贝靶位点(或两个不同靶位点)的B型DNA上,构建了同源二聚体或异源二聚体阻遏蛋白。实验表征表明,部分设计能够实现剂量依赖性的转录抑制(>2倍),并且所选设计在与同源靶标配对时表现出显著的正交性和高达20倍的抑制。在哺乳动物细胞中,通过将GCN4二聚化结构域和VP64激活结构域融合到DBPs的C端,创建了合成转录因子(synTFs),并使用ENGRAM记录技术测量了特定顺式调控元件(CREs)的活性,观察到3-5倍的激活。

Determinants of DBP design success

跨所有靶标的分析表明,成功结合其预期靶标的设计往往具有更多的侧链和主链磷酸氢键、更低的Rosetta ΔΔG以及AF2预测结构与设计模型之间更低的Cα均方根偏差(r.m.s.d.)。非特异性结合与净正电荷高度相关。研究还观察到,与形成磷酸氢键的侧链相比,具有更高Rotamer Boltzmann概率的侧链有所富集。对天然DBPs的分析表明,它们也具有能够形成主链磷酸氢键的几何形状和高度预组织的侧链磷酸氢键,这可能是由于这些相互作用的固有刚性有利于特异性对接并限制柔性侧链与脱靶DNA碱基原子的其他可能相互作用。为了探索介导特异性对接的磷酸接触对于实现给定靶位点特异性的重要性,研究人员对14个成功设计针对100个随机生成的靶序列进行了LigandMPNN重新设计。结果表明,只有少数序列具有与原始设计同样有利的Rosetta ΔΔG值和同样多的碱基氢键,这表明支架骨架和对接的细节通过锁定确切的结合模式并缩小可能的侧链-碱基接触范围,对特异性做出了重要的间接贡献。

综上所述,本研究开发的计算DNA结合剂设计方法能够生成特异性结合任意DNA序列的DBPs,包括那些不被PDB或JASPAR数据库中已知DBPs结合的序列。这些设计的DBPs在体外和活细胞中均发挥功能,能够在大肠杆菌和真核细胞中分别进行转录抑制和激活。该方法通过对结构多样的HTH支架进行采样,识别出能够与目标DNA碱基进行特异性接触的复合物。最佳设计对其预期靶标具有高度特异性,晶体结构和特异性分析实验强有力地证实了计算设计模型的准确性。结合模块的模块化使得能够通过RFdiffusion刚性定位多个模块 along the DNA double helix,从而进一步提高特异性。该设计方法现在能够为基因调控和编辑中的特定DNA序列靶向设计定制的DNA结合微型蛋白。虽然本研究作为原理验证专注于HTH结构域的设计,但该方法应可扩展至HTH结构域以外的DBP家族,特别是那些使用大沟螺旋进行识别的家族,如Cys2His2 ZF结构域或同源域结构域。未来的设计改进将包括考虑序列依赖性DNA形状、诱导契合以及水介导氢键的作用。将设计的DBPs通过同源二聚化和异源二聚化纳入转录调节剂的能力,应允许扩展用于复杂基因电路的正交TF-操纵子对。计算设计的DBPs也非常适合同时识别DNA序列和形状,包括可能发生在人类基因组中约13%的非B-DNA结构。该方法和序列特异性设计在合成生物学和其他需要序列特异性DNA识别的领域应具有广泛的用途。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号