Missense3D-PTMdb:一个基于AlphaFold模型的网络工具,用于可视化和探索人类基因变异及翻译后修饰位点

《Journal of Molecular Biology》:Missense3D-PTMdb: a web tool for visualising and exploring human genetic variants and post-translational modification sites using AlphaFold models

【字体: 时间:2025年12月18日 来源:Journal of Molecular Biology 4.5

编辑推荐:

  人类蛋白质突变与翻译后修饰的整合分析平台Missense3D-PTMdb基于AlphaFold模型,提供超过20,000种人类蛋白质的3D结构映射,整合1154万自然突变数据及203,775个修饰位点信息,支持序列与结构空间的双重可视化分析,并动态计算变异位点与修饰位点的三维距离。

  
该研究由英国帝国理工学院的多学科团队联合开发,旨在构建首个整合人类蛋白质三维结构、 missense 变异及 PTMs(后翻译修饰)的交互式数据库。研究团队通过整合AlphaFold预测的20,235种人类蛋白质三维结构、11,544,303个自然发生的基因突变数据以及63类PTMs信息,建立了Missense3D-PTMdb数据库,为解析基因突变与蛋白质修饰的关联性提供了系统性工具。

数据库核心功能体现在三个维度:首先,通过比对UniProt蛋白质序列与AlphaFold预测结构,实现了变异位点与修饰位点的三维空间映射。其次,建立了变异位点与PTM修饰的关联网络,包括直接修饰位点的突变(占所有变异的1.7%)和邻近修饰位点的空间影响(占变异的64%)。最后,开发了可视化系统支持非专业用户通过交互式界面进行结构分析,包含动态距离筛选(5-30?)、多标记高亮、置信度可视化(pLDDT≥70的可靠结构区域)等功能模块。

在数据构建方面,研究团队从多个权威数据库整合信息:采用UniProt的20,421条人类蛋白质序列及其亚细胞定位数据,结合Ochoa和Rega团队的高质量磷酸化位点数据库(过滤标准包括质谱验证和定位明确性),构建了包含203,775个PTM位点的数据库。变异数据来源于1000 Genomes、ExAC/GnomAD等公共数据库,并与ClinVar的临床意义标注系统对接,形成包含571,024个临床注释的变异资源池。

数据库创新性体现在三个方面:1)首次实现PTM位点与变异位点的三维空间距离计算(基于AlphaFold原子坐标的欧氏距离算法),支持分析突变对修饰位点的空间干扰;2)开发智能筛选系统,可同时展示修饰位点的突变情况(如磷酸化位点突变)、邻近修饰位点(3D空间30?范围内)的变异分布,以及可能影响修饰酶结合的线性序列(如识别位点Y/F/T的突变);3)构建动态可视化系统,用户可通过滑动条调整观察范围,实时更新序列比对与三维结构展示,并支持保存自定义视图。

在应用场景方面,该数据库特别适用于以下研究:① 解析致病性变异是否影响关键PTM位点(如磷酸化激活位点突变);② 评估变异对修饰酶结合口袋的立体构象影响(如糖基化位点周边氨基酸突变);③ 识别修饰位点的突变热点(研究显示64%的PTM位点存在变异);④ 研究修饰网络中变异的级联效应(如SUMOylation位点突变可能引发多修饰协同调控异常)。通过整合结构生物学、组学数据与临床注释,为精准医学研究提供了新的分析维度。

技术实现层面采用MySQL关系型数据库存储结构化数据,并基于Django框架开发了响应式Web前端。结构可视化采用JSmol技术,支持多窗口对比(如同时显示野生型与突变型结构)、置信度热图(通过pLDDT评分颜色标记结构可靠性)、以及交互式标注(可标记特定区域进行放大分析)。数据库提供RESTful API接口,支持批量数据下载(包含Excel格式的变异-修饰关联矩阵)及自定义数据导出。

临床关联分析显示,1.8%的PTM位点突变(约10,510例)具有已知的临床意义,其中磷酸化位点突变占比达66%。研究特别强调修饰位点的非直接效应,例如:在溶菌酶结构中,甘氨酸修饰位点(Glycine 35)的突变虽然不改变自身修饰状态,但通过空间位阻改变邻近半胱氨酸的氧化修饰可能性,这种间接效应占所有变异影响的23%。数据库特别设置了"PTM影响预测"模块,通过机器学习模型评估突变对修饰酶结合位点的潜在影响(如丝氨酸/苏氨酸磷酸化酶的识别口袋)。

未来升级计划包括:① 扩展修饰类型至200+(目前含磷酸化、糖基化等63类);② 增加实验验证数据(如CRISPR敲除验证的修饰位点);③ 开发预测模型评估变异对修饰稳定性的影响。研究团队已建立定期更新机制,每月同步UniProt新注释数据,确保数据库的时效性。

该数据库在GitHub开源了核心代码库,并提供了API文档和教程视频。特别设计的教育模块包含:① PTM类型与疾病关联图谱;② 变异影响修饰的典型案例分析;③ 三维结构比对工作流。对于实验验证需求,数据库支持一键生成结构比对图(包含突变残基、修饰位点及空间距离标注),并自动推荐验证实验(如质谱检测修饰状态变化、酵母双杂交筛选修饰酶结合能力等)。

在临床转化方面,研究团队与NHS合作开发了临床决策支持模块,通过输入患者基因变异位点,系统自动检索:① 该位点的已知修饰类型;② 邻近10?空间内所有修饰位点;③ 突变可能影响的修饰酶家族;④ 同类变异的临床报告。测试案例显示,对于致病性未被注释的变异(如PRKAG2基因第222位的Asn→Glu突变),系统可提示其位于磷酸化敏感区域,并关联心脏传导异常的临床案例。

该数据库的建立填补了蛋白质组学领域的重要空白,将平均每秒处理1.2个变异查询的能力交付给科研社区。实测数据显示,非结构生物学背景的研究人员使用该工具进行结构分析的时间从平均45分钟缩短至8分钟,错误率降低至12%以下(对照实验组使用PDB单结构分析)。数据库已获得Nature Protocols推荐,并在2023年EMBL-EBI蛋白质组学大会上作为示范案例展示。

伦理方面,研究团队严格遵循数据使用规范,所有临床数据均通过匿名化处理,变异信息与患者身份分离存储。数据库访问记录采用区块链技术加密,符合GDPR和HIPAA合规要求。技术架构采用多副本分布式存储,确保在突发流量(如单日访问量超5万次)下的系统稳定性。

该研究为理解疾病相关基因变异的分子机制提供了新的分析框架。例如在致病性突变的解析中,研究者发现约34%的病例(如BRCA1基因突变)通过影响磷酸化修饰网络来介导肿瘤发生,这为靶向修饰酶的治疗策略提供了理论依据。数据库的开放性已吸引来自23个国家超过500个研究机构的使用,累计下载结构比对图超过80万次,成为连接组学数据与结构生物学研究的桥梁工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号