ProteomeXchange联盟2026:推动蛋白质组学数据迈向FAIR化新纪元

【字体: 时间:2025年11月07日 来源:Nucleic Acids Research 13.1

编辑推荐:

  本文推荐了ProteomeXchange(PX)联盟在2023-2025年的重要进展。针对蛋白质组学数据共享标准化需求,研究人员系统报道了该联盟六大资源库的数据提交规模(截至2025年6月达64,330数据集)、对PSI标准(如USI、SDRF-Proteomics)的增强支持,以及数据重用生态(如AI模型训练、多组学整合)。该工作为大规模蛋白质组数据FAIR化管理提供了关键基础设施,显著促进生物医学发现。

  
随着质谱技术的飞速发展,蛋白质组学已成为生命科学和医学研究的核心驱动力。然而,海量数据的高效管理、标准化共享与深度挖掘一直是领域面临的严峻挑战。自2012年成立以来,ProteomeXchange(PX)联盟作为全球蛋白质组学数据资源的协调组织,致力于建立统一的数据提交与传播标准,推动数据FAIR(可查找、可访问、可互操作、可重用)化进程。2025年发表于《Nucleic Acids Research》的更新论文,系统展示了该联盟在过去三年的关键进展与未来规划。
为全面评估PX联盟的发展态势,研究团队整合了六大成员资源(PRIDE、MassIVE、jPOST、iProX、Panorama Public、PeptideAtlas/PASSEL)的运营数据,采用标准化统计方法追踪数据集增长趋势、物种与仪器分布。通过升级ProteomeCentral门户的API接口,实现了跨资源数据集的高级检索与元数据交互。同时,联盟持续推进蛋白质组学标准倡议(Proteomics Standards Initiative, PSI)制定格式(如mzML、mzIdentML、mzTab)的落地,并重点强化了通用谱图标识符(Universal Spectrum Identifier, USI)和样本数据关系格式(SDRF-Proteomics)的支持力度。在数据重用方面,团队部署了大规模重分析流程(如quantms、MassIVE.quant),并联合AI社区构建了专用训练数据集(如ProteomicsML)。
数据提交规模持续高速增长
截至2025年6月,PX资源累计接收数据集64,330个,其中近三年提交量占比高达47%(30,097个),2024年单年提交量突破10,686个。物种覆盖方面,人类样本居首,其次为小鼠、拟南芥等模式生物。质谱仪器以Thermo Scientific系列为主导。数据地理来源遍及80余国,美、德、中、英、法为前五大提交国。
技术标准支持与生态系统完善
联盟资源全面适配PSI标准格式,其中USI实现了跨资源谱图可视化互通,通过ProteomeCentral USI服务可调用Lorikeet或Quetzal等谱图查看器。SDRF-Proteomics的采用率显著提升,工具链(如lesSDRF、MaxQuant集成)日益成熟。jPOST团队更创新性推出JPDM(Journal of Proteome Data and Methods)数据期刊,以SDRF表格为核心辅助材料,激励研究者完善元数据标注。
数据重用活动呈现多元化趋势
  • 序列与翻译后修饰(PTM)资源构建:PeptideAtlas牵头完成人类蛋白质组93.6%的蛋白存在性验证,并系统重分析了水稻、疟原虫等物种的磷酸化数据,通过PTMeXchange项目向UniProtKB输送高质量PTM证据。
  • 定量数据重分析平台:MassIVE.quant采用分支结构存储原始数据、分析脚本及中间结果,支持可重复定量分析;quantms项目整合超29,000个原始文件,构建了跨组织、细胞系的血浆蛋白基线表达图谱。
  • 蛋白质基因组与多组学整合:通过重分析免疫肽组数据验证非经典开放阅读框(ncORF)翻译事件;OmicsDI平台实现了PX数据集与基因组、转录组资源的跨组学关联。
  • AI模型训练基础设施:MassIVE-KB谱图库涵盖59亿肽段参考谱,支撑了碎片预测(MS2PIP)、de novo测序等算法开发;ProteomicsML提供标准化数据集促进机器学习应用。
成员资源特色功能升级
PRIDE引入基于大语言模型的客服聊天机器人,并启动“亲和蛋白质组学”板块支持非质谱数据;iProX发布本地化提交工具iProXplorer;Panorama Public持续优化靶向蛋白质组可视化。
研究表明,ProteomeXchange联盟通过标准化管道与协同创新,显著提升了蛋白质组学数据的可及性与重用价值。未来,联盟将重点拓展受控访问数据(如人类敏感样本)的支持能力,并探索非质谱技术的整合框架。这些举措有望进一步打通蛋白质组学与临床医学、AI驱动的发现闭环,为精准医学提供底层数据支撑。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号