1. 引言
酶作为生物催化剂,其活性位点由较大蛋白支架支撑,而支架可能存在结构冗余。这些冗余在进化中对适应环境变化有重要作用,但在工业和治疗等典型应用条件下对催化功能贡献有限,还会带来诸多不良影响,如消耗更多细胞资源、增加错误折叠倾向等。在治疗领域,大尺寸酶(如 CRISPR 和 Cas 系统)在有效递送至靶组织和细胞方面存在限制;在生物传感诊断中,大尺寸氧化还原酶因辅因子与电极距离增加,会降低界面电子转移速率,影响检测灵敏度。因此,开发更小但功能等效的 “微型” 酶需求日益增长。
从自然进化中可获取灵感,细菌、古菌和真核生物的进化研究表明,在特定功能限制不存在时,生物倾向于产生更小蛋白质,如大肠杆菌中缺失发生频率是插入的 8 倍,人类中约 3 倍。这种趋势可能反映了在能量或编码能力有限的生物体中资源利用的优化。较小的酶不仅能降低合成和折叠的代谢成本,还可能增强耐热性和抗蛋白水解能力。
利用自然进化原理,可通过基因组挖掘等策略发现微型酶,如挖掘宏基因组数据库发现 Cas14,其大小是 Cas9 的三分之一,这为解决基因治疗中病毒载体有效载荷限制带来希望。但基因组挖掘也存在不足,可能因同源检测序列数量有限等原因无法找到所需更小同源物,故需创新策略实现酶微型化,目前已通过(半)合理设计、插入和缺失(InDels)及计算引导的从头设计等方法创造出微型酶,与传统酶工程方法不同,酶微型化旨在通过大幅减小尺寸同时保留功能来改变酶的物理性质,解决各种应用中的尺寸相关限制。
2. 微型酶的潜在内在优势
2.1 表达和折叠特性
酶由核糖体通过信使 RNA 翻译合成,随后释放到细胞环境中折叠成三维构象。任意酶的序列必须足够长以形成功能所需的三维折叠,但过长序列会导致合成能量成本更高、折叠更慢、错误折叠风险增加。蛋白质折叠速率范围广,序列长度是影响折叠速率的主要因素,折叠时间随序列长度呈指数增长,理论模型提出的缩放指数不同。粗粒度晶格模型表明,少于 200 个氨基酸残基的蛋白质可在生物学可行时间内折叠,超过该长度可能需要辅助机制如与伴侣蛋白共表达,这与细菌和古菌中天然蛋白质的平均长度相符。
较小的酶不仅折叠更快,还更可能形成催化功能所需的正确可溶构象,而较大蛋白质因更易陷入对应局部自由能最小值的瞬时亚稳态,更易错误折叠。对大量蛋白质的统计分析表明,蛋白质长度增加会降低以可溶形式成功表达的概率,尤其是超过 400 个残基的蛋白质。对大肠杆菌中哺乳动物蛋白质可溶性表达的调查也显示,大小是重要因素,较小蛋白质更易可溶性表达,这些研究凸显了较小酶在生物制造中的潜力。
2.2 热稳定性
酶的热稳定性是指酶在高温下长时间保持活性的能力,是工业应用的关键特性,熔解温度(Tm)是热稳定性的指标之一。虽然 Tm 本身与蛋白质大小无关,但底物结合后的热位移(ΔTm)与蛋白质大小呈负相关,较小酶结合后可能因对分子相互作用更敏感而具有更显著的 ΔTm,凸显了蛋白质大小在调节酶对底物结合的稳定性方面的微妙但重要作用。
大酶通常含有更多柔性环和无序末端区域,会损害热稳定性,而较小酶(尤其是去除这些柔性区域的工程化酶)因结构柔性降低和紧凑性增加而热稳定性增强。例如,从假坚强芽孢杆菌的 α- 淀粉酶 N 端结构域截短 200 个氨基酸残基后,热稳定性显著提高,最适温度升高,在高温下的活性保留率也大幅提升,说明较小蛋白质可实现热稳定性增强,有利于工业过程。
2.3 抗降解性
一些酶易受蛋白水解降解,这不仅会降低药物 efficacy,还可能通过患者的潜在不良反应带来安全风险。较大蛋白质在体内和体外的降解速率更快,表现出与大小相关的蛋白水解敏感性。例如,在小鼠大脑蛋白质组中,快速降解蛋白质的平均长度较长,稳定蛋白质的平均长度较短,这可能是因为较大蛋白质向细胞质暴露更大表面积,增加了蛋白水解的可能性,强调了减小蛋白质大小在设计稳定酶用于治疗和工业应用中的重要性。
3. 微型酶在生物催化和生物医学应用中的优势
3.1 工业过程
小酶在生产和应用中具有显著经济优势,较短序列合成成本更低,且功能位点密度更高,单位质量的催化单元更多,可减少实现等效催化性能所需的酶质量,提高工业过程的效率和成本效益。其内在的表达优势也直接转化为工业规模生产的益处,如溶解性更好、细胞能量成本更低、折叠速率更快、错误折叠倾向降低,可提高大规模发酵的产量并降低资源消耗,而大而复杂的酶在细胞培养中表达产量较低,需要更多细胞培养体积和更广泛的纯化处理,微型酶可解决这些限制。
酶固定化技术可增强酶的稳定性并实现工业过程中的多次重复使用,蛋白质大小对固定化效率影响很大,较大蛋白质进入和扩散到中孔时面临更大物理限制,尤其在多孔材料(如金属有机框架(MOFs))中,多数 MOF 孔径小,限制了较大酶的应用,而较小酶更易扩散到中孔载体并在纳米限制中保持天然构象,在酶固定化和相关生物转化中具有明显优势。
3.2 代谢疗法
酶因其高活性和选择性在治疗中具有巨大潜力,目前已有超过 120 种治疗性酶应用于临床,2023 年全球治疗性酶市场规模达 77 亿美元,预计 2030 年达 166 亿美元。但治疗性酶在人体中面临免疫原性、快速清除和无法靶向特定组织或细胞等挑战,可通过将酶或其信使 RNA 封装在作为递送载体的纳米载体中来缓解,而纳米载体的负载能力(单位重量载体的酶 cargo 量)受酶 cargo 与颗粒相对大小影响,较小酶更易容纳在纳米载体腔中,提高负载能力。例如,减少 mRNA 大小可降低空脂质纳米载体比例,提高治疗性转基因表达效率。
另一种递送方法是将治疗性酶与细胞穿透肽(CPPs)结合,促进跨细胞膜转运,CPPs 可通过直接穿透或内吞作用转运一定大小的蛋白质,酶 cargo 大小影响内化途径,小酶更可能利用能量独立的直接穿透途径,细胞摄取效率更高。对于必须进入细胞核修饰 DNA 的抗癌酶,大小必须低于通过核孔复合物被动扩散的阈值,超过一定大小的蛋白质核孔渗透速率显著降低。
3.3 基因组编辑
人类基因组中约 25,000 个注释基因中,超过 4,500 个突变与疾病表型相关,基于可编程核酸酶(如巨核酸酶、锌指核酸酶、转录激活因子样效应核酸酶和 CRISPR 相关核酸酶)的基因组编辑技术为治疗性基因组编辑带来可能,其中 CRISPR 相关核酸酶(如 Cas9)因设计简单、成本低、效率高而成为最广泛使用的工具。
近 70% 的基因治疗试验使用病毒载体(如腺相关病毒(AAV)、腺病毒和慢病毒),AAV 因其高转导效率、低免疫原性和向各种组织递送的高特异性,主要用于体内递送 CRISPR-Cas 效应器,但 AAV 载体有效载荷能力有限(约 4.7 kb),给某些 CRISPR-Cas 效应器(如 SpCas9)和向导 RNA 的有效递送带来挑战,较小的 Cas9 直系同源物(如 SaCas9、CjCas9、NmCas9)更适合 AAV 递送,但与其他元件融合后可能超过 AAV 载体有效载荷能力。
为克服递送挑战,研究人员通过基因组挖掘、合理设计和随机缺失等方法开发了微型 CRISPR-Cas 效应器,如 AsCas12f1 大小允许向导 RNA、Cas 蛋白及必要控制元件和追踪标记装入单个 AAV 递送载体,并成功编辑人类细胞中的靶基因,其紧凑尺寸克服了较大基因编辑系统需要多个递送载体的限制。
3.4 生物传感
酶因其卓越的催化功能和高底物特异性,常作为构建生物传感器检测复杂生物系统中靶分析物的关键组件,基于酶的生物传感器主要有电化学和光学两类,典型成员分别为氧化还原酶(如脱氢酶)和生物发光酶(如荧光素酶)。
脱氢酶(如葡萄糖脱氢酶和果糖脱氢酶(FDH))固定在电极上可检测血液样本中的特定分析物,检测依赖于脱氢酶利用辅因子作为电子载体促进电子从分析物转移到电极产生的电信号,但大尺寸氧化还原酶与电极结合时通常存在更大空间位阻,会损害电子转移,降低检测效率和准确性,较大脱氢酶因增加辅因子 - 电极距离而降低界面电子转移速率。通过合理设计开发的微型脱氢酶变体(如 Δ1c 和 Δ1c2c),缩短了关键辅因子与电极的距离,增强了电子转移速率,为开发更快的电化学生物传感器提供了设计原则。
荧光素酶通过催化荧光素氧化触发发光,为体内光学成像中融合靶蛋白的细胞表达和功能提供照明,较小荧光素酶(如 NLuc)具有增强的稳定性和发光效率,较大荧光素酶与靶蛋白融合时可能通过物理阻碍其活性位点或结合区域破坏靶蛋白的天然功能,且可能因荧光发色团与酶之间的空间位阻增加而降低生物发光强度,微型荧光素酶(天然发现、实验工程或人工设计)在解决这些挑战方面具有潜力,如 NanoLuc 荧光素酶作为生物发光共振能量转移(BRET)供体,发光强度显著高于大尺寸荧光素酶,归因于其与靶蛋白的空间位阻减少和固有发光特性增强。
4. 酶微型化策略
4.1 基因组挖掘
宏基因组是地球上各种生态系统中估计 10?–10?种原核生物物种的未开发酶的巨大宝库,其多样性增加了从不同物种中找到微型酶同源物的可能性。基因组挖掘结合预测生物信息学工具和重组 DNA 技术,通过筛选宏基因组数据库识别潜在微型酶。以 Cas 酶为例,寻找微型同源物通常包括定位具有高度保守序列元件的 CRISPR-Cas 位点、使用概率模型识别推定的 Cas 酶序列、根据蛋白质大小过滤鉴定的 Cas 簇等步骤,已成功鉴定出多种较小的 Cas 酶。
对于序列保守性低的酶,结构比较提供了解决方案,结构核心的进化速度比序列慢 3-10 倍,原子精度预测程序(如 AlphaFold、RoseTTAFold、ESMFold)的出现大大增加了蛋白质结构的可用性,结构比对程序(如 DALI、TMalign、Foldseek)可用于识别具有保守结构元件的蛋白质簇,如利用 Foldseek 聚类的 AlphaFold 数据库和已知 Cas13 蛋白中的代表性核苷酸结合域作为搜索查询,鉴定出目前已知最小的 Cas 效应器 Cas13an。
基因组挖掘方法可推广到选择性筛选广泛的微型酶,如通过 BLAST 分析使用保守氨基酸序列鉴定出真菌葡萄糖醛酸酯酶(GEs)的较小功能变体,表明该方法能有效识别保留催化功能的较小酶变体。
4.2 合理设计
合理设计基于对结构 - 功能关系的理解和冗余区域的识别,已用于创建各种酶的微型版本。以微型化 Cas13 为例,首先根据现有结构研究确定负责前 crRNA 加工、crRNA 识别和靶 RNA 切割的关键功能位点并保留,然后将其余结构组件分类为二级结构基序,根据其参与 RNA 底物相互作用的情况评估是否可去除,最终截短八个冗余区域,生成保留约 70% 野生型酶长度并保留全部 RNA 结合和切割活性的微型 Cas13 变体。
除 Cas13 外,合理设计还用于微型化其他酶,如通过多序列比对发现 Metridia 荧光素酶 N 端部分序列保守性低,删除 N 端一定数量残基后,生物发光活性显著增加。但合理设计的推广受实验数据稀缺或结构 - 功能关系理解不足的限制。
4.3 随机缺失
随机缺失可通过筛选不同序列区域的缺失突变库识别微型酶变体,无需机械输入,通过核酸酶消化或聚合酶链反应将靶酶基因片段化,然后连接这些片段构建重组变体。例如,使用体外转座法微型化连接酶,通过插入人工转座子序列、聚合酶链反应生成基因片段、连接到载体并切除转座子,产生大量突变体库,通过酶促测定鉴定出长度减少 20% 但活性与野生型相似的连接酶变体。
体外转座法的一个主要限制是吞吐量低,为解决这一问题,开发了迭代大小排除和重组(MISER)方法,通过在基因中每个密码子之间引入限制性内切酶识别位点,创建包含所有可能连续缺失的库,然后通过酶促测定识别可去除的片段并组装剩余片段成重组变体,该方法应用于微型化 Cas9,得到长度减少约 37% 但保留约一半野生型 Cas9 DNA 结合活性的变体。
4.4 从头设计
从头设计创造具有超出自然库存的新化学功能和 / 或蛋白质支架的酶,通常从创建用于催化感兴趣反应的理论活性位点(theozyme)开始,然后寻找能够容纳 theozyme 的现有蛋白质支架,优化活性位点周围的残基以最大化活性位点构象的稳定性和对过渡态的亲和力,这种计算方法已用于创建催化多种反应的酶,并通过实验验证。
随着深度学习作为构建非天然蛋白质支架的新方法的出现,创建微型支架变得更加可行,如利用无约束蛋白质幻觉设计环和可变区域结构、结构引导的序列优化设计酶核心区域,设计出仅含 117 个残基的人工荧光素酶 LuxSit-i,比通过合理设计方法得到的荧光素酶更小。类似地,通过提取工业 PET 降解酶的催化基序和相邻二级结构,利用深度学习模型生成短序列拼接结构,设计出比工业酶小 30% 以上的微型 PET 水解酶,尽管初始设计表达和活性较差,但在深度学习模型辅助下成功表达并表现出与工业酶相当的活性。
总之,酶微型化可通过基因组挖掘、合理设计、随机缺失和从头设计等策略实现,这些方法都需要通过重组 DNA 技术和生物测定进行实验验证以测试设计的微型化变体的功能,计算技术可加速微型酶的成功设计,为提高酶微型化的吞吐量和成功率,建议整合实验和计算。
5. 讨论和展望
天然存在的酶是多功能高效催化剂,传统工程方法对酶序列的修改有限,而酶微型化可赋予酶诸多优势,如改善表达水平、更快更准确折叠、增强热稳定性和抗蛋白水解能力,甚至可能增强催化性能,使其特别适合工业应用,并有望推动代谢和基因治疗的突破性进展,成为酶研究领域的新兴焦点。
酶微型化可与其他酶工程方法协同整合,如作为酶融合技术的理想候选者,创建紧凑的多功能嵌合酶,其较小尺寸允许更有效地融入融合构建体,同时最小化功能域之间的空间位阻,还可进行定向进化或诱变以进一步增强催化特性,较小的支架可能提供更大的进化可塑性,实现更快速的适应和优化,这些组合方法可能为工业和治疗应用产生具有前所未有机能和性能的新型生物催化剂。
小型酶是各种应用的理想工具,也是研究蛋白质动力学与催化之间复杂关系的有价值研究模型,通过减少酶结构的结构冗余,研究人员可更深入地了解结构灵活性和运动如何影响酶功能,创建具有高催化效率和原子经济性的最小酶,缩小酶催化和有机催化之间的差距,此外,酶的微型化有望发现新的蛋白质折叠,开启自然进化未触及的蛋白质领域。
近年来,蛋白质设计领域因人工智能的发展而迅速进步,但酶微型化仍然是一项重大挑战,蛋白质折叠依赖于疏水残基塌缩成紧密堆积的核心,同时将亲水残基暴露在表面,较短的蛋白质序列使这一过程复杂化,更难有效埋藏疏水区,增加错误折叠和蛋白水解的风险,即使是微小的设计缺陷也会显著降低微型化的成功率,此外,目前开发的用于蛋白质结构预测或从头设计的深度学习工具主要在标准大小蛋白质数据库上训练,应用于微型化任务时可能导致错误预测和不合理设计,因此,需要精心策划和注释的小蛋白质数据库以及针对这些数据集训练的专门模型。
鉴于上述重要性和挑战,酶微型化具有跨学科性质,需要化学生物学、结构生物学、物理和计算生物学等领域的合作,有望揭示新的催化机制和蛋白质折叠,丰富我们对酶学的理解,并扩展生物催化、合成生物学和制药行业的工具包,预计在微型酶的设计和工程方面将取得快速进展,并期待它们为解决各种应用中的复杂挑战提供创新的生物解决方案。