编辑推荐:
在冷冻电镜(cryo-EM)中,择优取向现象是常见问题。研究人员开展 cryoPROS 计算框架研究,通过共同优化原始和辅助颗粒纠正错位。结果显示其能实现近原子分辨率,验证了鲁棒性,为解决择优取向数据集问题提供新策略。
在生命科学研究领域,冷冻电镜(cryo-EM)凭借其在解析生物大分子结构方面的强大能力,已成为结构生物学的主流方法。然而,择优取向现象一直是困扰科研人员的难题。生物大分子在玻璃态无定形冰中本应呈现均匀随机的取向,但由于气 - 水或支撑物 - 水界面的相互作用,样本往往会呈现特定的择优取向。这使得传统计算方法分析择优取向数据时,密度图中常出现显著伪影,严重影响结构解析的准确性和分辨率,尤其对小蛋白的影响更为显著。尽管在样本制备和数据收集方面已有诸多尝试,如使用洗涤剂、增厚冰层、缩短点滴时间、进行生物分子修饰等,但这些方法要么需要耗时昂贵的条件筛选,要么效果因案例而异或仅部分有效。倾斜收集策略虽能绕过样本制备挑战,但也带来了图像采集效率降低、光束诱导运动增加、噪声水平升高以及需要精确散焦梯度估计等问题。因此,开发先进的计算算法来从先前未解决的择优取向数据集中重建高分辨率密度图迫在眉睫。
为解决这一关键问题,清华大学丘成桐数学科学中心、北京大学生命科学联合中心等国内研究机构的研究人员开展了相关研究,其成果发表在《Nature Communications》上。研究团队开发了 cryoPROS(PReferred Orientation dataset Solver)计算框架,旨在纠正择优取向导致的错位问题。该框架通过共同优化原始颗粒和辅助颗粒来实现这一目标,其中辅助颗粒由自监督深度生成模型生成。实验表明,cryoPROS 在处理择优取向数据集时表现出色,为冷冻电镜领域解决此类问题提供了新的有力工具。
研究人员为开展研究,主要用到以下几个关键技术方法:一是利用条件生成模型(conditional generative model)以自监督方式生成辅助颗粒,该模型基于分层变分自动编码器(VAE),无需训练样本即可合成辅助颗粒;二是采用共同优化模块,将原始颗粒与辅助颗粒结合,利用 cryo-EM 单颗粒分析软件(如 Relion、CryoSPARC、cisTEM)进行从头重建并重新估计姿态参数;三是针对膜蛋白开发了 ReconDisMic 算法,用于在初始参考模型中模拟胶束效应,以解决膜蛋白研究中洗涤剂胶束或脂质纳米盘的影响。
错位:处理择优取向数据集的关键挑战
在许多择优取向数据集中,非择优视图的颗粒并非完全缺失,但其数量远少于择优视图的颗粒。这种高度不平衡的姿态分布给传统的 2D 或 3D 分类方法带来了挑战,这些方法通常依赖 K-means 聚类并假设簇大小相等,导致非择优视图颗粒的信号常被优势择优视图的信号所掩盖,在优化过程中会导致错位,并在后续重建中引入或放大伪影。通过对合成的择优取向数据集 Uni-HA-Syn 和 PO-HA-Syn 的研究表明,常规优化方法会因错位导致重建分辨率显著下降,而使用各向同性参考模型也不足以纠正错位,这凸显了开发新计算工具的必要性。
cryoPROS 方法:纠正择优取向引起的错位
cryoPROS 通过深度生成模型合成辅助颗粒,以增强组合数据集的姿态平衡。其生成模块利用条件 VAE 框架,以原始颗粒和成像参数(包括 CTF、姿态参数和低分辨率 3D 参考模型)为输入,生成姿态均匀分布的辅助颗粒。共同优化模块将原始颗粒与辅助颗粒结合,利用现有软件进行全局共同优化,估计原始颗粒的姿态参数,还可进行局部优化和后处理以进一步提高密度图质量。对于膜蛋白数据集,集成的 ReconDisMic 算法可有效处理胶束效应。
多个择优取向数据集的验证
在多个数据集上的实验验证了 cryoPROS 的有效性。在模拟数据集 PO-HA-Syn 中,cryoPROS 显著改善了密度图,恢复了 Z 轴缺失的密度,模型到图分辨率达到 2.62?,远优于传统自动优化方法。在手动筛选的 PO-TRPA1 数据集和广泛认可的 HA-trimer 基准数据集上,cryoPROS 均能恢复高质量的密度图,甚至利用未倾斜的 HA-trimer 数据实现了接近原子分辨率的结构,性能可与倾斜收集数据的最先进结果相媲美。对于未发表的实验数据集 P001-Y、NaX和 HSL-dimer,cryoPROS 也成功解析了高分辨率结构,展示了其在膜蛋白和其他复杂体系中的广泛适用性。
cryoPROS 的模型偏差风险分析
模型偏差风险评估是确保 cryoPROS 可靠性的重要环节。研究表明,cryoPROS 生成的辅助颗粒噪声通过自监督神经网络生成,与原始颗粒的噪声分布更为接近,KL 散度和信噪比(SNR)等指标均优于添加高斯噪声的方法,且不会产生 “爱因斯坦从噪声” 效应导致的伪密度。通过不同初始参考模型的实验以及频率相关性分析等,验证了 cryoPROS 的低模型偏差风险,确保其结果的可靠性。
讨论
cryoPROS 为冷冻电镜中择优取向导致的错位问题提供了系统的解决方案。其利用深度神经网络生成辅助颗粒,增强了数据集的姿态平衡,提高了对齐精度,无需额外数据收集或复杂的颗粒级优化即可实现高分辨率重建。与倾斜收集策略相比,cryoPROS 在处理择优取向数据集时具有显著优势,且二者可互补,共同推动冷冻电镜技术的发展。此外,cryoPROS 在生成辅助颗粒方面的创新为冷冻电镜数据处理开辟了新方向,未来结合深度学习的最新进展,有望进一步拓展其应用场景。该研究不仅解决了冷冻电镜领域的关键技术难题,也为结构生物学和药物研发等领域提供了强大的工具支持,具有重要的科学意义和应用价值。