综述：用于鉴定酶肽底物的mRNA展示技术

《Biochemistry》：mRNA Display for Identifying Peptide Substrates of Enzymes

【字体：大中小】 时间：2026年06月09日 来源：Biochemistry 3

编辑推荐：

　　在各类展示技术中，mRNA展示已成为筛选目标蛋白从头配体的有力手段。将相同方法应用于研究蛋白质/肽修饰酶的底物则受到的关注少得多，但该领域在过去5年中进展迅速。本文综述了截至2025年12月已发表的、专门利用mRNA或cDNA展示鉴定和理解酶底物偏好性的研究工

在各类展示技术中，mRNA展示已成为筛选目标蛋白从头配体的有力手段。将相同方法应用于研究蛋白质/肽修饰酶的底物则受到的关注少得多，但该领域在过去5年中进展迅速。本文综述了截至2025年12月已发表的、专门利用mRNA或cDNA展示鉴定和理解酶底物偏好性的研究工作。文中归纳了这些报道随时间推移呈现的趋势，并对该领域未来的发展方向进行了思考，旨在为相关领域的研究人员提供实用入门参考。

引言

展示技术是筛选大量多肽以获得理想特性（通常是对靶蛋白的结合能力）的有力手段。噬菌体展示是最成熟的技术，1985年首次报道了在噬菌体颗粒上展示抗原，2018年诺贝尔化学奖的一半授予George P. Smith和Sir Gregory P. Winter正是表彰其在“肽和抗体的噬菌体展示”方面的贡献。此后涌现出许多替代性展示技术，包括细菌和酵母细胞表面展示，以及核糖体展示或mRNA展示等无细胞方法。筛选流程通常由多轮亲和富集组成，通过与固定化的靶蛋白结合实现。这些展示技术最大的应用是鉴定结合配体，或更具体地说，鉴定治疗相关靶点的抑制剂（尽管不能保证配体一定具有抑制活性），这些配体可以基于现有支架（如抗体或其片段）或新型模式如环肽。肽类配体可能被视为抑制剂发现的技术要求而非理想特性，这是利用模板化核糖体翻译筛选并随后解析万亿级不同分子文库的不便但必要的手段。简单肽通常不是理想的临床候选分子，通常血浆半衰期短且被动膜通透性较差，但也有克服这些障碍的案例。2000年代初DNA编码文库的发明正是为了解决这一问题，它保留了筛选大文库并通过DNA测序解析的优势，无需核糖体合成，但也面临自身挑战。研究人员已采用创新方法调整展示技术以提高肽类药物的前景，最显著的是密码子扩展/重编程。这可以通过用氨酰-tRNA合成酶可识别的类似物替换“天然”（即蛋白源性）氨基酸（nAAs）并将其转移至相应tRNA来实现，或通过flexizyme预先酰化tRNA。Flexizyme能够用任何羧酸进行酰化，不受与nAAs相似性要求的限制（但必须注意的是，即使充电完成后，氨基酸也可能与核糖体翻译的后续步骤不相容）。本文不涉及对该领域的全面讨论，建议读者参阅其他文献以获取更多信息。本文重点关注利用体外展示技术、以酶对肽的修饰为富集核心步骤来鉴定酶底物的系统性工作，排除了仅结合而不被所研究酶进行酶促修饰的配体的鉴定。底物鉴定的最直接应用是酶作用于未修饰的天然肽。天然肽展示可用于获取翻译后修饰（PTMs）的信息，如糖基化、磷酸化、乙酰化或甲基化；肽切割（如蛋白酶）；或与另一个肽底物连接。mRNA展示（及其他体外展示方法）的一个关键优势是能够超越nAAs，以模板化方式掺入非天然氨基酸（UAAs——特指非蛋白源性氨基酸），例如翻译后修饰的氨基酸（PTMs），从而能够解析需要多种修饰组合的结合相互作用，或一种修饰的添加依赖于另一种修饰存在的情况，如组蛋白尾部、泛素或O-糖蛋白。底物鉴定与配体发现在方法上有许多相似之处，但也存在一些关键差异。初始步骤类似：制备DNA文库，转录为RNA并与适当的含嘌呤霉素寡核苷酸连接，然后进行翻译（可选择掺入UAAs）以生成与编码mRNA链共价连接的肽，再进行逆转录生成cDNA。在mRNA展示中，肽通过mRNA形成复合物与cDNA相连，并作为肽-mRNA/cDNA复合物进行筛选。在cDNA展示中，cDNA链从嘌呤霉素寡核苷酸引发，因此直接与肽共价连接；这可以作为肽-cDNA/mRNA复合物进行筛选，也可以去除mRNA并以肽-cDNA复合物形式筛选。为了本文目的，我们不严格区分这些方法。与配体发现工作不同，配体发现的富集是通过与靶标结合实现的，而修饰后的肽不会保持与酶结合，因此需要额外的捕获步骤，且该步骤针对每种研究的酶是定制化的。在分离修饰和未修饰序列后，回收cDNA并通过PCR扩增，以创建后续轮次的输入文库和/或通过下一代测序（NGS）进行分析。酶促修饰前和/或后步骤也可用于促进捕获步骤区分底物和非底物。这些步骤可以是化学和/或酶促的，构成了底物鉴定工作流程的关键部分。

文献案例

研究人员共确定了24篇符合标准的文献报道，即通过mRNA/cDNA展示肽的酶促修饰来研究底物特异性，这类报道远少于从头环肽配体的报道（自2015年以来约每1.5个月发表1篇），甚至偶然发现也极为罕见。已知一例由Kawamura等人报道的无意底物发现，当时一个抑制性环肽可以通过理性修饰转化为底物。缺乏类似报道或许并不令人惊讶：大多数筛选活动的目的是发现抑制剂，因此探索命中序列是否为底物充其量只是次要考虑。从头配体中存在可修饰残基并不能保证底物活性，脯氨酸羟化酶2的含脯氨酸肽配体就是如此。除非主动寻找修饰肽，否则这些肽很容易在筛选过程中被去除，或者即使富集，也不会像其他更强效的配体那样被优先考虑进行后续表征。

所有确定的报道按研究的酶类型分组：翻译后修饰（PTM）4篇；蛋白酶10篇；转谷氨酰胺酶4篇；核糖体合成翻译后修饰肽（RiPP）合成酶6篇（注：有一篇文章同时涉及PTM和蛋白酶两类酶，在两部分均有涵盖）。每组报道均详细涵盖了研究的酶、文库设计和序列多样性，以及底物鉴定特有的实验步骤（即酶促修饰、酶促修饰前和/或后处理、捕获），并简要总结了研究结果。

翻译后修饰

本部分的四篇论文中，三篇报道的是引入额外基团（磷酸化或糖基化）的PTM，捕获通过针对修饰的特异性抗体实现。这种抗体使用似乎仅限于PTM研究，需要考虑抗体本身的潜在表位偏好，这可能影响鉴定的底物。第四篇关于酪氨酸酶的研究，虽然据我们所知并非内源性PTM，但因其活性不属于其他类别且涉及肽内氨基酸的修饰而被归入此类。

2002年，Cujec等人报道了首个已知的利用mRNA展示鉴定底物的研究，他们测定了Abelson鼠白血病病毒酪氨酸激酶（v-Abl激酶）的肽底物，该蛋白与其人类同源物C-Abl激酶均为已知的致癌基因。初始筛选使用了随机肽文库，包含保守的中心Tyr残基，两侧各有5个由NNS密码子编码的随机氨基酸，N端和C端恒定序列各包含一个Cys残基。作者指出这些半胱氨酸可用于将随机区域约束成环状，但本研究未进行此操作。文库与v-Abl激酶孵育，磷酸化底物用磷酸酪氨酸特异性抗体捕获。经过六轮筛选，通过转化大肠杆菌对富集的肽进行测序，并对69个单菌落进行链终止法测序。由于当时大规模平行测序方法尚未成熟，这种测序水平获得的信息细节有限。大多数克隆匹配已建立的底物序列基序I/L/V–Y-X_1–5-P/F，几乎所有克隆在随机区域内都包含额外的Tyr残基。两个克隆不再含有保守的中心Tyr，其中一个在可变区内确实含有一个Tyr。总体而言，该随机肽文库未产生清晰的共有序列，因此为了深入了解v-Abl激酶的细胞靶点，研究人员使用源自人骨髓细胞的mRNA模板文库进行了第二轮筛选。来自该细胞筛选的结果也鉴定出几个先前在体内已确认的v-Abl底物，以及新的靶点如含SH2结构域的Shg蛋白。此外，来自细胞mRNA-蛋白文库的底物序列与随机肽文库筛选中鉴定的序列高度匹配。

随后，Kozlov等人对人Abl激酶（也称为C-Abl）进行了筛选。他们使用了设计的包含3243个成员的10聚体肽文库，包含各种酪氨酸激酶的已知底物序列及其衍生物，以及不含Tyr残基的阴性对照。所有肽均在N端含有TEV蛋白酶位点，用于酶促修饰前步骤以生成N端Cys，随后使用生物素-PEG硫酯进行生物素化。洗脱的cDNA-肽偶联物与Abl激酶孵育，然后通过链霉亲和素固定化纯化文库并洗脱，再用抗磷酸酪氨酸抗体捕获底物。经过一轮筛选，库中超过90%的已知底物组（GEAIYAAPFA及除Tyr5外的所有单点突变体，共198个肽）被鉴定出来，以及4%的至少含1个酪氨酸的1355个序列。从GEAIYAAPFA组推断的序列偏好与先前确立的偏好一致。

除了激酶，Shi等人利用mRNA展示研究蛋白质O-GlcNAc修饰（Ser/Thr/Tyr残基的修饰），同样使用针对安装的修饰的抗体来捕获修饰肽。文库包含一个起始甲酰甲硫氨酸、9个由NNK密码子编码的可变残基和一个(Gly–Ala)₃间隔区。该文库的理论多样性为5.12×10¹¹，但声明的实际达到多样性为5.12×10⁹，因为在这些大文库规模下，反应规模通常是限制因素，即每个序列在起始时仅对应单个分子。进行了四轮人O-GlcNAc转移酶（OGT）修饰，每轮均包含预清除步骤（将未修饰文库与固定化抗体孵育以去除具有固有抗体结合能力的肽），然后使用RL2抗O-GlcNAc抗体捕获修饰肽。富集序列被连接并转化到大肠杆菌中，随后对单菌落进行测序；16个独特肽中有14个含有Ser/Thr残基（被认为是OGT的主要O-GlcNAc糖基化受体位点），但在重新合成和后续实验中，没有一个被证明是底物。随后的早期轮次深度测序显示文库仍保持高度多样性，除了出现一个意外肽段RESSYDIYRVPSSQS（称为ZO-3），它太长不可能源自X₉文库，且之前被用作该方法优化的阳性对照。作者认为它是作为污染物进入筛选的，尽管已采取了预防措施。在他们早期的实验中，观察到OGT处理后ZO-3的富集度（约4倍）高于未处理组，这归因于受体位点靠近C末端（上划线部分），邻近嘌呤霉素连接子寡核苷酸，可能导致抑制。为了验证这一假设，研究人员制备了ZO-3的变体，其与dsDNA寡核苷酸在N端连接。该变体的肽和寡核苷酸之间的连接子短得多：约12个原子（“N端展示”变体）对比mRNA展示中使用的嘌呤霉素连接子寡核苷酸的约100个原子，因此不是直接比较。尽管如此，N端连接的ZO-3在用OGT孵育后用RL2抗体回收的效率远高于未处理组（约2400倍）。作者得出结论，mRNA展示文库中mRNA附着在C端的位置阻碍了底物修饰，这是一项重要发现，也是mRNA展示方法的固有局限性。另一个突出的缺点是由抗体表位偏好引起潜在偏差的可能性，并建议了几种替代方法来克服这一点，包括使用叠氮修饰的UDP-GlcNAc底物通过OGT作用直接安装叠氮基团，或随后修饰安装的GlcNAc以添加替代纯化手柄；后一种方法在许多其他报道中可见。

为了发现具有高亲和力结合构象的从头肽配体，mRNA展示通常与各种肽环化策略相结合。然而，使用酶进行环化可能会给后续筛选带来偏差。为了研究利用酪氨酸酶实现肽环化的潜力，Fleming等人使用mRNA展示表征了巨大芽孢杆菌酪氨酸酶（megTYR）的底物偏好。为此，他们构建了一个包含甲酰甲硫氨酸起始子、不变酪氨酸和4个由NNK编码的随机氨基酸区域的文库（总多样性16000），将其暴露于megTYR中，将酚基转化为邻醌。在这种情况下，通过在megTYR反应中加入生物素-半胱胺进行原位修饰步骤；生物素-半胱胺的巯基选择性地与生成的邻醌在C5位（以及在较小程度上在C2位）反应。然后可以用链霉亲和素磁珠捕获修饰的肽。进行了三轮重复筛选，分别使用6种酶浓度（2 μM–0.125 μM，2倍稀释），结果显示对于megTYR浓度在1 μM及以上、反应时间为1小时的条件下可实现接近定量的回收。考虑到较低回收率对揭示底物偏好更有意义，对0.125 μM的筛选结果进行了测序（总回收率约50%）。分析显示位置效应很小，表明特异性广泛，这对于生成环肽的应用是有用的。含Pro的肽是差底物，效应在紧邻不变Tyr处最强，随距离增加而减弱。Asn、Gln、Glu，特别是Asp在整个文库中富集，但令人震惊的是，含Cys的底物高度耗竭。这归因于Cys侧链的优先分子内巯基攻击胜过了与生物素-半胱胺的分子间反应，导致捕获效率低下，这对生成无偏见的环肽文库是有希望的。文章后面展示了利用该方法鉴定出黑色素瘤相关抗原A4（MAGE-A4）的有效酪氨酸酶环化肽抑制剂。总体而言，这四篇论文展示了展示技术的进步以及可用于文库生成和反应性筛选的各种方法。同时也强调了该方法的某些缺陷：使用抗体作为捕获剂可能会给结果引入自身的表位偏差，并且重要的是要记住附加的编码寡核苷酸可能不是无害的，并可能影响筛选。这种情况在文献报道中可能比暗示的更为常见，因为“失败的筛选”不易发表。

蛋白酶

关于蛋白酶特异性研究的报道最为丰富，也许是因为展示方法很容易应用于此类酶；在N端固定化使得肽骨架切割易于读数和分离。

Ju等人于2007年发表了首篇研究蛋白酶的报告。Caspase家族是介导凋亡途径的关键蛋白水解酶，但caspase激活促进细胞死亡的特定机制尚不清楚。研究人员利用mRNA展示通过采用代表人类蛋白质组的文库来理解Caspase的天然底物。简而言之，从人脑、心脏、脾脏、胸腺和肌肉中提取Poly(A)⁺mRNA，生成cDNA并通过PCR扩增，引入mRNA展示所需的特征：上游T7启动子和下游嘌呤霉素连接位点。这还在编码区引入了N端AviTag和C端FLAG或His₆标签，PCR产物经分馏以获得长度为80–200个氨基酸的肽序列，作者指出这可能足够长以采用天然构象甚至三级结构。在这种情况下，文库多样性未知，但上限为9×10¹¹（每轮使用1.5 pmol mRNA）。在酶促修饰前步骤中，使用BirA将AviTag生物素化，允许肽固定在链霉亲和素-琼脂糖珠上。然后与蛋白酶孵育切割底物，将带有编码mRNA的C端片段释放到溶液中。该片段通过FLAG或His₆亲和标签捕获，附着的mRNA通过PCR扩增并用于后续轮次。对于caspase-3，进行了三轮筛选，并通过连接到载体并转化大肠杆菌来鉴定序列。为了能够鉴定富集程度较低的底物，通过互补寡核苷酸杂交去除了12个最丰富的序列，并重复测序。总共从580个克隆中鉴定出207种独特蛋白，其中115种被确认为caspase-3底物，89种是新发现的，并含有已确立的DXXD基序。对caspase-8采用了类似过程，后续工作理清了仅被caspase-3切割、仅被caspase-8切割或同时被两者切割的底物比例。在进一步的实验中，研究了颗粒酶B（一种来自caspase家族外的蛋白酶）。为了鉴定颗粒酶B的非caspase底物，首先将文库与七种caspase（2、3和6–10）孵育，洗涤去除切割序列，然后与颗粒酶B孵育，鉴定出超过60种底物。

在与前述Abl激酶相同的手稿中报道，Kozlov等人利用覆盖整个病毒翻译基因组的3001个10聚体肽组成的文库，研究了丙型肝炎病毒（HCV）NS3/4A蛋白酶的潜在切割位点。如前所述，所有肽均在N端含有TEV蛋白酶位点GENLYFQ↓CA，用于酶促修饰前步骤以生成N端Cys，随后使用生物素-PEG硫酯进行生物素化，并将文库固定在链霉亲和素包被的磁珠上。与磁珠结合的肽与HCV NS3/4A孵育，切割将C端肽/cDNA偶联物从磁珠上释放，未切割序列保持结合。筛选鉴定出三个先前已知的切割位点（¹⁷⁰⁸MEEC↓SQHL¹⁷¹⁵、¹⁹⁶⁹TTPC↓SGSW¹⁹⁷⁶和²⁴¹⁷VVCC↓SMSY²⁴²⁴）和两个先前未知的切割位点（²¹⁶⁸VAVLT↓SMLTD²¹⁷⁷和⁶⁷²QVLPC↓SFTTL⁶⁸¹）。然而，作者指出这些新位点很可能不具有生物学相关性，因为它们对应于内部位置，在折叠状态下无法被蛋白酶接近，这凸显了肽展示方法的一个潜在缺点，即序列通常缺乏二级结构。

使用相同的程序，同一研究小组又发表了五篇研究不同蛋白酶的文章。Shiryaev等人同时报道了HCV NS3/4A的研究，使用了不同的文库设计，包含来自病毒多蛋白的超过2600个8聚体。他们的数据显示每个位点都有重要的残基，但并不总是相同的；在某些情况下，它们靠近切割位点（P1/P1′），而在其他情况下则更远端（高达P6），并观察到一个新趋势，即Asp或Glu在P6和P6位富集。

随后，对人furin进行了分析，以更好地理解其在发育（敲除在小鼠中是致死的）和疾病病理中的作用。使用计算步骤识别人蛋白质组中潜在的furin切割位点后，设计了包含5860个肽的文库：3260个预测/已知切割位点和2600个来自其他蛋白酶的非furin对照序列。结果揭示了490个可能的位点，远多于当时数据库中报道的150个。这些结果还强调了短程（P4–P1）和远程（P7–P6）相互作用对furin特异性的重要性，并且先前确定的共识基序R-X-R/K/X–R↓本身不足以预测切割位点。

接下来，研究了脆弱拟杆菌的金属蛋白酶MPII和FRA3，它们是人类大多数厌氧感染的病原体。使用生物素化的10聚体肽文库（包含316个序列，基于先前结果编译）。超过80个肽是MPII的底物，超过230个是FRA3的底物，具有不同的共有序列偏好：分别为G(R/G)LR↓RX(R/G)和P(R/A)(P/G/S)L(R/A/L)↓。在后续报告中，使用更大的包含18583个成员的设计文库进一步研究了MPII和FRA3。研究了不同的酶浓度；高浓度（4 μM）导致更多的非特异性切割，而低浓度（40 nM）降低了灵敏度，但有助于鉴定最具特异性的底物。中间浓度（400 nM）筛选获得了大部分数据，再次显示MPII偏好P1位的Arg/Lys和P1′位的Arg，而FRA3特异性较低，对P1位的Lys/Arg和P1′位的脂肪族（Leu/Val/Met）偏好较弱。

最后，使用与上述相同的18583个成员10聚体文库研究了一组18种基质金属蛋白酶（MMPs）。筛选使用了仅催化结构域的构建体，理由是10聚体肽应仅占据MMP的底物裂隙，而不与辅助结构域相互作用。为了验证这一点，对全长MMP-2和MMP-9以及仅催化结构域进行了初步筛选，未发现显著差异。对于所有MMPs（除了-7和-19，这与之前的报道一致），鉴定出超过500个Z-score >2.5的底物（基于测序读数与对照样品统计分析的底物效率度量）。数据还显示同一亚家族内的MMP具有相似的底物范围，但与其他亚家族不同，尽管大约50%的底物被所有MMP切割。获得的数据也与之前开发的预测MMP切割位点的模型密切相关。

Iskandar等人使用不同的文库设计和类似的筛选方法研究了胰凝乳蛋白酶，这是一种肠道内肽酶，可切割蛋白质内敏感键的羧基侧疏水性芳香族残基。胰凝乳蛋白酶的活性导致肽类药物降解，极大地限制了其口服生物利用度，因此为了促进设计抗蛋白水解稳定的肽类药物，研究人员利用mRNA展示来确定抗性肽的身份。在本研究中，N端生物素化文库（使用flexizyme将N-生物素-l-Phe在起始密码子AUG处重新编码）与胰凝乳蛋白酶孵育。文库在六个位置使用NNW密码子随机化（总多样性3.4×10⁷），在翻译过程中排除Met和Cys，允许通过flexizyme介导的充电将Trp掺入UGU密码子。肽与胰凝乳蛋白酶孵育，然后使用链霉亲和素分离；底物留在溶液中，而胰凝乳蛋白酶的非底物保留N端生物素并被固定化。然后回收肽并进行测序。在有和没有胰凝乳蛋白酶的情况下进行筛选。NGS数据分析显示Trp、Phe、Tyr和Leu残基减少，与当时MEROPS数据库中报道的先前切割序列一致。他们还看到Pro、Glu和Asp的富集增加，这表明这些残基具有稳定作用。使用NGS数据训练了一个简单的基于机器学习的分类器，以预测肽是否会被胰凝乳蛋白酶切割。在筛选过程中，未回收或特异性鉴定切割残基；因此，该模型的目的是预测肽被鉴定为稳定的概率。作者通过合成一组代表几种观察到的趋势的肽并测量它们在胰凝乳蛋白酶存在下的半衰期来验证计算结果。他们的计算模型显示出良好的预测能力，真阳性率约为70%，真阴性率约为80%。值得注意的是，分类器可以预测含有Phe、Tyr、Leu或Trp的肽是不稳定的。

采用类似的方法，Zhu等人（预印本）确定了三种了解甚少的蛋白酶的特异性：factor Xa、ADAM17和链球菌溶素，开发了一种能够筛选窄范围和宽范围蛋白酶的方法。文库包含由核苷酸三联体编码的8聚体，以消除密码子偏倚（详见后面的章节），两侧是已知具有蛋白水解稳定性的Pro-Gln-Pro“框架”。N端恒定区域还包含His₆标签和通过抑制琥珀终止密码子（UAG）编码的非天然氨基酸（UAA）对丙氧基-l-苯丙氨酸（pPaF）；C端恒定区域包含连接子序列。文库总多样性为2.56×10¹⁰。展示的肽通过pPaF残基与叠氮功能化的琼脂糖珠进行Cu(I)催化的炔-叠氮环加成（CuAAC）共价连接，然后用蛋白酶处理，切割带有编码mRNA/cDNA的C端区域，便于直接回收。利用这种方法，确定了factor Xa蛋白酶的切割模式为P1–P2位置的G/A-R↓基序，这与已确立的I-E/D/G-R↓位点一致，但未发现P3或P4位置的强烈偏好。此外，还发现了一个以前未知的Q-R↓切割位点。对于ADAM17，筛选显示QAV↓或QRV↓是最丰富的可切割基序，存在于609个独特序列中。链球菌溶素的筛选证实了先前关于P1位疏水氨基酸偏好的研究；此外，还报道了了解较少的位置P3（Y、I、M、F和V）和P1′（F）的偏好。在每种情况下，富集程度最低的两个序列也被证明可被各自的蛋白酶消化，显示了该方法的有效性和选择性。虽然展示方法可用于鉴定底物，但无法直接确定肽内的切割位点；这需要通过使用化学合成肽和LC-MS分析进行后续实验来确认。这些数据与NGS数据一起被纳入计算模型以生成特异性基序。

为了理解UAA掺入对蛋白水解活性的影响，Turra等人使用mRNA展示探究甲硫氨酸氨基肽酶（MAP）对高炔丙基甘氨酸（Hpg）（一种被甲硫氨酸tRNA合成酶识别的Met替代物）的活性。设计了四种不同的文库，均包含N端Hpg（在Met、AUG处编码），紧接着是Ala或Xaa（随机）、4或8个由NNS密码子编码的随机氨基酸（总多样性AX4：1.6×10⁵；X5：3.2×10⁶；AX8：2.56×10¹⁰；X9：5.12×10¹¹）、C端His标签和连接子区域。翻译步骤在没有Met的情况下进行，在所有位置都用Hpg替代。使用两阶段过程鉴定每种文库的MAP底物。在第1轮中，翻译后的肽通过逆转录引物中包含的光裂解生物素固定在链霉亲和素磁珠上。固定化后，进行逆转录，然后用肽脱甲酰基酶（PDF）处理以去除Hpg残基的N端甲酰基；MAP只能作用于带有氨基的N端残基。肽-mRNA/cDNA复合物通过光裂解释放，通过Ni-NTA琼脂糖经由C端His标签纯化，洗脱的肽再次与链霉亲和素磁珠孵育，去除任何固有的磁珠结合序列。然后未结合的肽与生物素-PEG₁₁-叠氮化物反应，然后第三次与链霉亲和素磁珠孵育，此时固定的序列代表正确翻译和“可点击”的序列，从中回收cDNA并扩增作为第2轮的输入。然后对每种文库进行两个平行的Rd2筛选，一个与上述相同，不同之处在于最终链霉亲和素固定化步骤的“Rd2-MAP结合”和“Rd2-MAP未结合”序列均被测序。对于第2轮中的“+MAP筛选”，文库与PDF和MAP同时处理，导致底物序列的Hpg被切割，因此在最终链霉亲和素固定化后包含在“未结合”池中。对于“-MAP筛选”，“Rd2+MAP结合”和“Rd2+MAP未结合”序列也均被测序。结合所有测序池的信息显示，底物适应性的主要决定因素是P1′位置，强烈偏好具有小侧链的氨基酸（如Gly、Ala、Ser和Pro），而带电荷和大体积残基（如Asp、Lys、Tyr和Trp）接受度差。这些分组与之前的发现一致，尽管平均切割效率从85%到20%不等，而预期一些底物会被定量切割，而另一些则完全不被切割（即100%或0%）。对此提出了各种原因，包括这些值是平均值，因此可能存在特定的序列，根据下游残基的不同，其切割率为100%或0%。为了进一步研究下游残基，他们检查了P1′位置残基切割率约为50%的底物，揭示了P2′的一些效应（例如Trp有利于切割，Pro或Glu不利于切割）、P3′和P4′位置，但这些效应随着距离的增加而减弱。含Cys的肽被强烈排斥，这与之前的文献报道形成对比。总体而言，通过mRNA展示进行蛋白酶底物分析是一项相对简单的工作；N端亲和标签足以分离底物和非底物，这也许就是为什么这么多蛋白酶以此方式被研究的原因。至关重要的是，mRNA展示无法直接识别切割位点，因此需要针对单个肽的后续工作来获得全貌。

转谷氨酰胺酶

转谷氨酰胺酶（TGs）是一类通过催化赖氨酸残基的ε-氨基与谷氨酰胺残基的羧酰胺交联来翻译后修饰蛋白质的酶。TGs参与细胞分化、信号转导和癌细胞转移。为了理解TGs如何激活这些生理过程，了解这些酶的肽底物特异性可能是有价值的，多个研究小组已利用展示技术对此进行了研究。

此前，Keresztessy等人以及后来的Sugimura等人分别对转谷氨酰胺酶-2（TG2）和微生物转谷氨酰胺酶（mTG）进行了噬菌体展示筛选。对于TG2，鉴定出一个共有序列pQX(P,T,S)l（其中p和l分别表示极性和脂肪族氨基酸），而对于mTG，最富集的基序是LxRQRY。然而，残基特征并不明确，亚位点特异性仍然难以捉摸。此后，又有几篇报道使用mRNA展示表征TG底物。

Lee等人的报告在此基础上，利用mRNA展示针对链霉菌属摩巴伦斯转谷氨酰胺酶（STG）进行筛选。作者评论说，与噬菌体展示活动相比，他们的工作实现了显著更大的文库规模（10⁹对比10¹³）。文库设计为编码10个残基的随机区域，由NNS密码子编码（总多样性1×10¹³）。使用捕获式检测方法，其中六赖氨酸（K₆）磁珠作为胺供体，在STG孵育后捕获反应性底物，使其发生交联。经过六轮展示，鉴定出105个序列并通过固定潜在反应性Gln残基进行比对，强调Pro在+1位是最常见的氨基酸，Arg在-3位显著出现。观察到部分共有序列，LQQ和TQP分别重复了八次和七次。后续工作表明三肽底物对STG无活性，五肽是最小活性底物长度。基于序列比对数据，作者设计了基于筛选中鉴定的序列ASMERLQQPN的五肽RLQQP（TQ1），结论是TQ1是比TG2更具特异性的STG底物。

在后来的研究中，Damnjanovi?等人（2022）使用mRNA展示鉴定TG2的底物。mRNA展示文库是基于先前已知的TG2底物（称为T26）设计的。在他们的文库中，T26肽相对于反应性谷氨酰胺残基在-1、+1、+2和+3位随机化。通过NNK密码子引入随机化，生成一个包含1.6×10⁵个成员的文库。在TG2孵育期间，使用戊胺-生物素（PAB）作为胺供体，导致反应性谷氨酰胺底物生物素化。然后可以通过与链霉亲和素包被的磁珠下拉分离交联的底物。这项工作确定了TG2对Gln在-1位的强烈偏好，与之前鉴定出底物Gln–Gln基序的报道一致。还确定了Ile或Val在+3位的偏好。作者强调了他们的结果与之前通过噬菌体展示获得的结果之间存在一些差异。当前研究未发现+2位Pro的偏好。此外，T26肽序列在其数据集中排名>2000，富集因子为2，而最高富集因子的命中（fMQQVCIDPWMLDH）富集因子为7。

2023年，Bowler等人试图利用mTG的活性在mRNA展示文库中建立一种新的大环生成策略，以鉴定强效环肽抑制剂。在确认mTG对mRNA展示反应性Gln底物具有活性后，他们使用PAB在mTG处理期间捕获底物，使用的肽文库包含起始甲硫氨酸、3个随机残基（由NNK密码子编码）侧翼为一个不变Gln、Gly-Ser间隔区和HA标签。正如TG2所报道的，NGS分析揭示了两个关键趋势：（1）芳香族残基在反应性Gln的两侧均富集；（2）影响肽灵活性的氨基酸（Gly和Pro）在所有位点均被消耗。总体而言，NGS数据显示没有单一序列基序被富集（序列收敛度<0.03%），因此mTG显示出最小的底物偏倚，这是环肽文库生成的有益特征。他们接下来评估了mTG在Gln到Lys交联步骤中与mRNA展示底物的相容性和偏倚。他们设计并筛选了两个文库，均以N-生物素-l-Phe作为通过flexizyme重编程的起始密码子掺入，然后是四个或六个由NNK密码子编码的随机位置，侧翼为Gln和Lys（分别称为NNK₄和NNK₆，多样性分别为1.6×10⁵和6.4×10⁷）。用mTG处理文库后，使用胰蛋白酶蛋白酶在未被环化的底物中切割Lys。这将生物素标签从遗传物质上移除，防止非底物的序列富集。NGS数据的分析揭示了与之前检测类似的趋势，观察到高度序列多样性，且Pro是被消耗最多的氨基酸。观察到的一个显著趋势是Gln残基更接近反应性的C端Lys，这可能表明大环环尺寸可能比序列环境对环化的影响更大。总体而言，作者得出结论，mTG不会给环肽抑制剂筛选引入显著的底物偏倚，他们随后在此背景下利用该方法鉴定出钙和整合素结合蛋白（CIB1）以及免疫检查点蛋白B7–H3的高效环肽结合剂。他们的环肽筛选鉴定出这些靶点的高亲和力、低纳摩尔级抑制剂，且这些大环显示出高度的序列多样性。

在Nakano小组的进一步工作中，Munaweera等人研究了转谷氨酰胺酶-1（TG1）的底物偏好。已知TG1对皮肤发育很重要，并且该酶的异常表达怀疑与阿尔茨海默病有关。文库设计基于先前报道的K5肽YEQHKLPSSWPF，该肽显示出对TG1的高反应性和选择性。一个文库K5-SRL在5个位置同时变异，使用NNK密码子XXQXKLXXXWPX（总多样性：1.3×10⁹个肽）。使用的另一个文库K5-SML包含单点突变，其中肽xxQHKLxxxWPx内的六个位置之一随机化，在每个位置给出19种不同的变体，K5-SML总多样性为115。如前所述，使用PAB捕获和分离与编码mRNA融合的交联底物。来自文库筛选的NGS数据分析显示，+4位的Pro、-1位的Glu和+9位的Phe对序列富集很重要。有趣的是，从K5-SML文库筛选中鉴定出一个反应性更高的序列pep 1–1：AEQHKLPSKWPF（与亲本K5肽的变化用斜体标出），该序列对TG1也表现出比TG2和TG3更高的特异性。这些研究的结果是鉴定出高活性肽，可用作进一步研究这些酶的探针。特别是，底物偏好信息能够实现TGs的人类蛋白靶点的鉴定。

RiPPs

核糖体

热点排行