
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:超越进化:从头设计蛋白质工具包重塑合成生物学规则
【字体: 大 中 小 】 时间:2025年09月14日 来源:Biosafety and Health 3
编辑推荐:
本综述系统阐述了人工智能(AI)驱动的从头(de novo)蛋白质设计如何突破自然进化限制,为合成生物学提供原子精度可编程的功能模块(如酶、生物传感器、治疗蛋白),并构建从理性遗传电路到全合成细胞系统(Syn-cells)的层级化设计框架。文章强调需结合多组学分析与闭环验证(design-test-learn cycle)以应对生物安全风险,展望了人工智能虚拟细胞(AIVC)平台在预测生物端点(毒性、脱靶效应)方面的关键价值。
人工智能(AI)驱动的从头(de novo)蛋白质设计正在彻底改变合成生物学领域。这一技术摆脱了自然进化历史的约束,直接从功能需求出发逆向设计结构及序列,实现了原子级别的精确编程。与传统定向进化或噬菌体展示技术不同,AI驱动的方法不依赖天然模板,能够生成大量具有新颖拓扑结构和功能的蛋白质候选分子。
该设计范式与合成生物学的多层次架构(模块、电路、系统)高度契合。蛋白质作为基础功能模块(如酶、调控元件),可组装成复杂遗传电路,并进一步集成至全合成细胞系统(Syn-cells)。AI设计工具(如RFdiffusion、ProteinMPNN)通过整合序列-结构-功能(SSF)多模态数据,生成高维蛋白质空间表征,支持精准探索隐藏的蛋白质功能景观。
过去二十年间,DNA测序技术和蛋白质结构测定数据的积累为AI模型训练提供了基础。深度学习算法(如Alphafold2、RoseTTAfold All-atom)实现了从序列到结构的高精度预测,而扩散模型和图神经网络(如RFdiffusion、ProteinMPNN)则能够生成全新蛋白质骨架和优化序列。实验验证数据持续反馈至训练集,形成“设计-测试-学习”(design-test-learn)闭环,迭代提升设计成功率与可靠性。
AI驱动的蛋白质理性设计已在多个应用场景中展现出突破性进展,其优势主要体现在三方面:
结构与功能预测
Alphafold2等工具能够直接从氨基酸序列预测三级结构,并提供pLDDT(预测局部距离差异测试分数)和Cα RMSD(均方根偏差)等量化指标用于虚拟筛选。序列到功能预测工具(如DPFunc)可推断关键功能区域,减少湿实验验证负担。
蛋白质优化
AI方法能够改善蛋白质的溶解性、热稳定性和表达产量。例如,ProteinMPNN重新设计肌红蛋白后,部分变体在95°C下仍保持血红素结合活性,且与设计模型高度吻合(Cα RMSD=0.66??)。iMARS框架通过解析人工多酶复合物的空间结构-功能关系,将白藜芦醇产量提高45.1倍。
从头蛋白质设计
AI设计流程已成功生成经实验验证的新颖结构和功能。例如:
新型丝氨酸水解酶设计变体催化效率(kcat/Km)达2.2×105?M?1?s?1,晶体结构与设计模型偏差小于1??;
遗传编码生物传感器(Ras-LOCKR-S/PL)可检测内源Ras活性并在亚细胞分辨率标记微环境;
针对蛇毒神经毒素设计的结合蛋白(SHRT)亲和力达0.9?nM,完全保护小鼠免受致死剂量毒素攻击;
变构可控蛋白质纳米组装体可用于药物递送载体和基因开关。
这些设计蛋白质具备正交性、模块化和可编程特性,为合成生物学提供了标准化功能模块,支持从酶工程到生物治疗应用的广泛场景。
AI驱动的从头设计通过原子精度设计补充了传统“乐高式”模块组装策略,但仍面临挑战:当前AI模型仅输出静态结构,难以捕捉蛋白质构象动力学(如诱导拟合、变构效应);实验验证不足且标准不统一;缺乏对复杂翻译后修饰(PTMs)的建模。未来需整合计算-实验管道、标准化验证流程以及显式生物复杂性建模。
AI设计蛋白质的结构新颖性带来独特的生物安全与伦理挑战:增强的热稳定性可能导致环境持久性和生物累积;新表位可能引发免疫激活或自身免疫反应;现有序列筛查无法覆盖无自然同源性的功能蛋白。当前国际监管框架(如NIH、WHO、卡塔赫纳议定书、欧盟AI法案)存在覆盖空白。
建议采取以下治理策略:
伦理嵌入设计(Ethics-by-design):在项目启动阶段进行双重用途评估;
功能优先筛查:整合AI预测器(毒性、结合活性)至合成订购流程;
动态监管触发:基于平台能力(模型规模、自动化程度)实施监督;
混合治理:结合现有生物安全制度与AI专用控制措施。
技术层面需采用安全设计策略,如闭环验证结合高通量检测、多组学分析(转录组、蛋白质组、代谢组)评估系统级响应,以及基于LLM(大语言模型)和ODE(常微分方程)的模拟预测。最小底盘设计和合成调控电路(降解标签、杀伤开关)可进一步控制蛋白质活性和清除。
未来合成生物学将采用分层框架:从原子精度设计工具生成稳定且代谢兼容的蛋白质模块,通过图神经网络标准化生物元件库,最终集成至全合成细胞系统。人工智能虚拟细胞(AIVC)平台(如“whole-cell”模型)能够高保真模拟细胞内动力学,提前预测生物安全端点(毒性、脱靶相互作用),减少试错依赖。这一框架将推动合成生物学在可持续生物制造和个性化生物医学领域的突破。
AI驱动的从头蛋白质工程通过原子级别可定制设计扩展了合成生物学的应用边界。未来需将生成模型与生物物理机制(折叠、动力学、PTMs)结合,提升细胞内环境预测 fidelity,并实施功能优先的安全筛查流程。AI辅助定向进化、无细胞验证平台等技术将进一步提高成功率并降低风险。结合AI驱动验证管道、标准化库和整合建模平台,合成生物学正从经验性工程转向系统性、可预测且更安全的设计范式。
生物通微信公众号
知名企业招聘