GlyContact:大规模解析糖链三维结构及其功能意义的新工具
《Nature Communications》:GlyContact analyzes glycan 3D structures at scale
【字体:
大
中
小
】
时间:2025年12月13日
来源:Nature Communications 15.7
编辑推荐:
本研究针对糖链三维结构分析难题,开发了开源Python工具GlyContact,可高效处理MD/NMR/X射线数据,揭示序列背景对糖基motif结构的影响,提升lectin结合预测准确率~7%,并首次实现基于von Mises图神经网络的二糖扭转角预测,为糖生物学功能研究提供新范式。
糖链是生命体中最复杂的生物分子之一,它们像树枝一样分叉,结构多样且高度灵活。这种特性使得糖链的分析和结构表征变得异常困难,导致糖链的结构与功能之间的关系往往模糊不清。随着糖生物学的发展,科学家们越来越认识到,糖链的三维结构对其生物学功能起着决定性作用,但如何系统性地分析这些结构一直是个巨大挑战。
在这项发表于《Nature Communications》的研究中,Luc Thomes、Roman Joeres、Zeynep Akdeniz和Daniel Bojar团队开发了一个名为GlyContact的开源Python工具包,专门用于检索、处理和分析糖链的三维结构。这个工具能够处理来自分子动力学模拟、核磁共振和X射线晶体学的糖链结构数据,为糖生物学研究带来了革命性的突破。
为了开展这项研究,团队整合了GlycoShape数据库中717种糖链的6,911个三维构象,并开发了自动化的结构注释流程。关键技术方法包括:(1)基于Shrake-Rupley算法的溶剂可及表面积计算;(2)通过均方根波动和扭转角变化评估糖链灵活性;(3)使用Kabsch算法进行糖链结构比对;(4)基于Cremer-Pople参数的环构象分析;(5)开发von Mises混合模型的图神经网络预测扭转角分布。研究还利用了UniLectin3D数据库的1,437个lectin-糖链复合物结构进行验证。
GlyContact聚合并计算糖链跨构象的结构特性
研究人员首先建立了高效的数据处理流程,能够自动识别糖链序列并映射到对应的三维结构。GlyContact成功处理了GlycoShape数据库中98.7%的结构,平均每个糖链的处理时间不到0.1秒。通过计算构象间的单糖距离和接触图谱,工具能够揭示溶液环境中糖链的局部和长程相互作用。特别值得注意的是,GlyContact计算的溶剂可及表面积和灵活性参数显示,即使是同一单糖在不同糖链位置也表现出显著异质性,这一发现在传统的糖链"扁平"文本表示中是完全隐藏的。
通过系统性的结构比对分析,研究发现糖链三维结构形成了明显的类别聚类,这种聚类主要与糖链的大小和分支程度相关。利用创新的"双胞胎"分析流程,研究人员发现核心岩藻糖的添加会降低糖链的平均可及表面积,表明结构更加紧密。相反,植物N-糖链中β2-木糖的引入则使结构更加"开放"。更重要的是,研究发现相同的序列motif在不同糖链类型中会表现出不同的结构特性,例如sialyl-LacNAc motif在N-糖链中的表面暴露程度低于其他糖链类型。
研究团队深入分析了58种常见lectin的结合特性,发现lectin的结合不仅取决于序列特征,更依赖于motif的特定三维构型。例如,RCA-I lectin偏好表面可及性高的LacNAc motif,而SNA lectin则对motif的灵活性有强烈偏好。通过分析co-crystal结构,研究发现lectin倾向于选择特定构象的糖链进行结合,这种现象被称为构象选择。对真菌galectin ACG的分析显示,该lectin与乳糖的罕见构象结合,而这种构象与其偏好配体血型A抗原的常见构象相似。
研究人员将糖链三维结构特征整合到深度学习模型中,开发了LectinOraclestruct模型。该模型在预测lectin-糖链结合方面比基准模型性能提升7.4%,表明结构信息提供了序列无法替代的价值。更令人惊讶的是,团队开发的von Mises-SweetNet模型能够仅从糖链序列预测扭转角分布,预测误差仅为±7°-±10°,即使对从未见过的二糖也能生成真实的Ramachandran图。这一发现表明,与蛋白质类似,糖链的三维结构信息在很大程度上已经编码在其序列中。
研究结论强调,考虑糖链结构对于分析其功能至关重要。GlyContact通过将成熟的糖信息学流程与空间维度相结合,使结构糖生物学领域更易于广大研究人员访问。讨论部分指出,虽然当前研究主要基于分离糖链的分子动力学结构,但未来需要更多糖蛋白环境下的结构数据来验证这些发现。研究还警示,AlphaFold3等工具提供的糖链结构只是静态快照,无法捕捉糖链在分子动力学模拟中表现出的广泛构象灵活性。
这项研究的重要意义在于为糖生物学研究提供了全新的分析维度。GlyContact不仅能够揭示糖链序列背景对motif结构的影响,还能解释lectin结合的特异性,为糖工程和糖靶向治疗药物的合理设计提供了重要见解。随着更多糖链三维结构数据的积累,这种结合三维结构信息的分析方法有望成为糖生物学研究的新标准,推动整个领域向更深入的功能机制研究迈进。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号