
-
生物通官微
陪你抓住生命科技
跳动的脉搏
冷冻电镜结合人工智能指导的蛋白质鉴定技术推动样品纯化工艺革新
【字体: 大 中 小 】 时间:2025年06月06日 来源:Journal of Structural Biology: X 3.5
编辑推荐:
本研究针对蛋白质纯化过程中常见的共纯化污染物问题,创新性地整合冷冻电镜单颗粒分析(Cryo-EM SPA)、深度学习工具ModelAngelo和蛋白质序列比对(BLAST)技术,成功鉴定出大肠杆菌表达系统中顽固性污染物二氢硫辛酰胺琥珀酰转移酶(DLST)。通过建立"结构到序列"的自动化工作流程,研究人员不仅解析了2.51 ?分辨率的DLST催化域结构,更开发出含甘氨酸和精氨酸的缓冲液配方,使目标纳米颗粒产率提升58倍。该成果发表于《Journal of Structural Biology: X》,为蛋白质科学领域的纯化难题提供了AI驱动的解决方案。
在蛋白质科学领域,样品纯度一直是决定研究成败的关键因素。无论是解析蛋白质结构、探究生物机制,还是表征人工设计的蛋白质纳米材料,纯化过程中的共纯化污染物都会严重影响实验结果的可信度。尤其对于自组装的蛋白质纳米材料,这些意外出现的"搭便车者"可能被误认为是新的组装状态、交叉污染或是宿主天然蛋白,导致研究结论出现偏差。更棘手的是,传统质谱鉴定方法在面对含去污剂的样品时往往束手无策,而常规的纯化策略对这些顽固污染物收效甚微。
针对这一行业痛点,来自美国华盛顿大学蛋白质设计研究所的研究团队开展了一项创新性研究。他们以实验室反复出现的未知污染物为突破口,建立了一套整合冷冻电镜(Cryo-EM)、人工智能和生物信息学的蛋白质鉴定流程。研究聚焦于一种在多种设计蛋白样品中反复出现的八面体对称纳米颗粒,该污染物严重干扰了目标纳米颗粒的组装和表征,在某些样品中占比高达96.5%。
研究人员采用多技术联用的策略:通过冷冻电镜单颗粒分析获得2.51 ?分辨率的三维结构;利用深度学习工具ModelAngelo进行序列无关的原子模型构建;结合蛋白质序列比对(BLAST)鉴定污染物身份;最后通过AlphaFold 3预测和Western Blot验证结果。针对鉴定出的DLST污染物,团队系统优化了纯化方案,发现添加100 mM甘氨酸和100 mM精氨酸的缓冲液可几乎完全去除DLST,同时将目标纳米颗粒的产率从3.79 μg提升至220 μg。
研究结果部分揭示了四大发现:
"利用电子显微镜表征未知共洗脱蛋白污染物"显示,该污染物呈现约18-20 nm的立方体形态,与设计的八面体纳米颗粒(25-30 nm)明显不同。动态光散射(DLS)检测到30.9 nm和223 nm两个峰,分别对应目标纳米颗粒和聚集体,而6.30 nm峰被确认为去污剂胶束。
"ModelAngelo结构到序列鉴定污染物蛋白"部分证实,通过序列片段拼接生成的共有序列经BLAST比对,98%的顶级结果指向DLST。与PDB中DLST晶体结构(1SCZ)和AlphaFold 3预测模型的比对显示高度一致,均方根偏差(RMSD)仅0.51-0.52 ?。Western Blot在50 kDa处检测到强烈信号,与DLST亚基分子量吻合。
"修订纯化方法提高de novo双组分蛋白质纳米颗粒纯度"部分发现,传统梯度洗脱无法去除DLST,而高盐缓冲液虽能消除污染物但大幅降低目标产量。突破性解决方案是添加甘氨酸和精氨酸,使目标纳米颗粒占比从3.53%跃升至99.5%,电镜图像显示DLST几乎完全消失。
"冷冻电镜分辨率对DLST准确鉴定的影响"测试表明,在3.00-4.75 ?分辨率范围内,共识序列的BLAST分析准确率超过95%;在5.00-6.50 ?范围,ModelAngelo内置的hmmsearch功能保持约50%准确率;而6.50 ?以下分辨率则无法获得可靠结果。
讨论部分强调,这项研究不仅解决了实验室具体的纯化难题,更建立了一个可推广的技术框架。通过将冷冻电镜与AI工具结合,研究者成功将"污染物鉴定"这一传统难题转化为可标准化操作的流程。特别值得注意的是,该工作流程在中等分辨率(4-7 ?)下仍保持良好性能,这对难以获得高分辨率结构的样品尤为重要。
研究还意外发现了DLST催化域中未表征的密度特征,可能暗示新的结构特征或结合配体,为后续酶学研究提供了线索。从更广泛的角度看,这项工作展示了计算生物学工具如何与传统实验方法协同解决实际问题,为蛋白质科学领域树立了"发现问题-技术整合-方案优化"的研究范式。
这项研究的创新之处在于:首次系统报道了DLST的去除方案;建立了分辨率自适应的污染物鉴定流程;展示了AI工具在实验科学中的实用价值。正如作者所言,该方法可扩展应用于其他表达系统和蛋白类型,特别是在结构生物学和纳米材料领域具有广阔应用前景。
生物通微信公众号
知名企业招聘