
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Ligand.MHC图集:破译人类癌症免疫肽组以驱动精准免疫治疗
【字体: 大 中 小 】 时间:2025年07月11日 来源:Briefings in Bioinformatics 6.8
编辑推荐:
为解决肿瘤免疫治疗中因HLA多态性导致的肿瘤表位识别难题,研究人员开发了Ligand.MHC Atlas这一综合性数据库,通过整合5821个免疫肽组样本(305.7百万MS2谱图),识别出1,017,731个独特MHC配体(包括582,852个HLA-I和434,879个HLA-II肽),并注释了372,720个肿瘤相关PTM(后翻译修饰)肽。该资源覆盖26种人类癌症(54亚型),结合优化的去卷积算法,显著扩展了癌症免疫肽组图谱,为个性化癌症疫苗和T细胞疗法提供靶点筛选基础,加速免疫治疗研发。
癌症免疫治疗正迎来革命性突破,但仍面临严峻挑战:尽管免疫检查点阻断剂(ICBs)为晚期患者带来希望,但耐药性和严重副作用频发,且疗效因癌症类型和个体差异悬殊。究其根源,肿瘤细胞表面呈现的抗原肽(表位)是T细胞识别的关键,但HLA分子的高度多态性(如HLA-I超过27,000个等位基因)导致肽结合特异性复杂多变,传统方法难以全面捕捉肿瘤特异性表位。这阻碍了癌症疫苗、过继T细胞疗法(ATCs)等个性化治疗的精准设计。例如,黑色素瘤临床试验中,结合表位疗法可将18个月无进展生存率从62.2%提升至78.6%,突显了精确表位鉴定的迫切性。
在这一背景下,中南大学的研究人员联合多个团队,在《Briefings in Bioinformatics》发表了题为“Deciphering the MHC immunopeptidome of human cancers with Ligand.MHC atlas”的研究。他们构建了Ligand.MHC Atlas——一个专注于肿瘤来源MHC(主要组织相容性复合体)呈现配体的开源数据库。研究团队从公共蛋白质组数据库(如PRIDE、MassIVE)系统收集并处理了112项已发表研究的5821个样本,涵盖305.7百万MS2谱图,覆盖26种主要人类癌症(54亚型),包括肺癌、乳腺癌和黑色素瘤等高发癌种。通过高通量质谱数据分析,结合机器学习驱动的配体去卷积,该图集实现了对肿瘤免疫肽组的深度挖掘。
研究采用的关键技术包括:(1)数据采集与注释:从公共数据库筛选人类DDA(数据依赖采集)质谱数据,要求样本类型(癌/正常/疾病)和HLA等位基因信息明确;(2)肽段识别:使用pFind 3.2.1搜索引擎,以开放搜索模式处理高/低分辨率谱图,严格控制PSM(肽段-谱图匹配)的FDR(错误发现率)<1%;(3)修饰鉴定:基于Unimod数据库识别16种常见PTM,如磷酸化、乙酰化;(4)批次效应控制:按质谱类型(FTMS/ITMS)和碎裂方法(HCD/CID)优化流程;(5)HLA配体去卷积:整合NetMHCpan 4.1、MixMHCpred 2.0等6个工具,以加权评分策略分配肽-HLA结合强度(强结合≥2分)。样本队列主要源自患者组织(如HLA-I样本中75.6%为组织样本),确保了临床相关性。
研究处理了305.7百万串联质谱图,涵盖3493个癌症样本,其中肺癌、乳腺癌和黑色素瘤的配体数量最多。通过严格流程,识别出31,680,822个PSM,包括24,380,595个HLA-I和7,300,227个HLA-II匹配。去卷积后,582,852个HLA-I独特肽和434,879个HLA-II独特肽被关联到292个HLA等位基因(152个HLA-I和140个HLA-II)。HLA-I配体长度集中于8-12个氨基酸,HLA-II则以15个氨基酸为主。与现有数据库(如caAtlas、SysteMHC Atlas)相比,Ligand.MHC Atlas补充了38个独特数据集,覆盖更多癌种,并新增了18个HLA-I和28个HLA-II等位基因的结合配体。

Ligand.MHC Atlas提供用户友好的网络平台,支持数据集浏览、搜索(简单、高级、肽段
生物通微信公众号
知名企业招聘