《Journal of the Egyptian National Cancer Institute》:Bidirectional mendelian randomization identifies plasma proteins associated with cervical cancer risk
编辑推荐:
宫颈癌持续对全球健康构成重大挑战,亟需创新性方法以改进诊断和个性化治疗策略。既往研究提示血浆蛋白可能参与宫颈癌的发病机制,然而这些研究未能证实因果关系。为填补这一空白,研究人员开展了一项大规模血浆蛋白质组孟德尔随机化(MR)研究。研究人员采用双样本双向孟德尔随
宫颈癌持续对全球健康构成重大挑战,亟需创新性方法以改进诊断和个性化治疗策略。既往研究提示血浆蛋白可能参与宫颈癌的发病机制,然而这些研究未能证实因果关系。为填补这一空白,研究人员开展了一项大规模血浆蛋白质组孟德尔随机化(MR)研究。研究人员采用双样本双向孟德尔随机化分析方法,涉及4,907种血浆蛋白,利用可公开获取的全基因组关联研究(GWAS)汇总统计数据,检验血浆蛋白质组与宫颈癌风险之间的因果关联。分析方法包括逆方差加权法(IVW)、加权中位数法、MR-Egger回归法以及简单和加权模型。此外,研究人员进行了敏感性分析,通过Cochran's Q检验、MR-Egger截距、MR-PRESSO检验和留一法分析评估异质性和水平多效性。研究人员还对所有IVW方法的结果应用错误发现率(FDR)校正,以识别与宫颈癌关联最强的血浆蛋白。最后,研究人员使用京都基因与基因组百科全书(KEGG)和基因本体论(GO)分析及GeneMANIA对最相关的血浆蛋白编码基因进行富集分析,以识别疾病相关通路。根据IVW方法,七种血浆蛋白与宫颈癌风险显著相关(P < 0.05)。具体而言,六种蛋白显示保护因素:DEFB135(OR = 0.201,95% CI = 0.082–0.492,P < 0.001)、FGL2(OR = 0.104,95% CI = 0.032–0.338,P < 0.001)、FTMT(OR = 0.612,95% CI = 0.465–0.804,P < 0.001)、PDIA4(OR = 0.088,95% CI = 0.026–0.295,P < 0.001)、SPHK2(OR = 0.102,95% CI = 0.030–0.350,P < 0.001)和TMED2(OR = 0.045,95% CI = 0.008–0.246,P < 0.001)。相反,RACGAP1(OR = 1.755,95% CI = 1.286–2.395,P < 0.001)被鉴定为风险因素。反向MR分析显示宫颈癌与这些血浆蛋白之间无显著反向因果证据(P > 0.05)。功能富集分析鉴定出若干可能参与宫颈癌发病的生物学相关通路,包括细胞器定位的建立、氧化还原酶活性的调节、铁死亡(Ferroptosis)和卟啉代谢。这些发现提示DEFB135、FGL2、FTMT、PDIA4、SPHK2和TMED2可能对宫颈癌具有保护作用,而RACGAP1可能代表潜在的风险因素。所鉴定的肿瘤标志物为宫颈癌的分子基础提供了机制性洞见,值得在功能研究中进一步验证。
本研究发表于《Journal of the Egyptian National Cancer Institute》,旨在利用大规模蛋白质组学数据探究血浆蛋白与宫颈癌之间的因果关系。宫颈癌是全球女性癌症相关死亡的主要原因,国际癌症研究机构(IARC)的流行病学数据显示其在常见女性癌症中的发病率和死亡率尤为显著。人乳头瘤病毒(HPV)高危亚型的持续感染是宫颈癌的主要危险因素,HPV的E6和E7蛋白通过与宿主细胞蛋白相互作用促进细胞恶性转化和肿瘤发生。当前治疗策略 heavily 依赖铂类化疗药物如顺铂,但药物耐药性的出现频繁影响疗效并导致疾病复发。世界卫生组织(WHO)强调早期发现和及时干预对减轻宫颈癌负担至关重要。近年来,血浆蛋白因其诊断和预测疾病、识别治疗靶点及阐明多种疾病病理生理机制的能力而成为药物开发的重要靶点。然而,传统观察性研究常受混杂因素和反向因果关系的限制,导致结论不确定。蛋白质定量性状位点(pQTL)与孟德尔随机化(MR)分析的整合增强了因果推断能力,利用单核苷酸多态性(SNP)作为工具变量推断暴露因素与结局之间的因果关系,可减少混杂偏倚并避免反向因果的干扰。随着高通量蛋白质组学技术的快速发展,研究人员已通过MR分析建立了血浆蛋白与多发性硬化症、痤疮和乳腺癌等多种疾病之间的因果关系,但血浆蛋白与宫颈癌的因果关系仍知之甚少。
研究人员采用双样本双向孟德尔随机化方法,利用deCODE数据库中35,559名冰岛个体的血浆蛋白质组学GWAS数据(共4,907种血浆蛋白)作为暴露数据,以芬兰数据库finngen_R10_C3_CERVIX_UTERI_EXALLC队列中388例宫颈癌患者和182,927例对照(排除所有癌症)的GWAS汇总统计作为结局数据,所有分析仅限于欧洲裔个体以减少人群异质性偏倚。研究基于MR分析的三个核心假设:相关性假设(工具变量与暴露因素强相关)、独立性假设(工具变量与混杂因素无关)、排他性限制假设(工具变量仅通过暴露因素间接影响结局)。研究人员使用R软件(v 4.3.2)中的TwoSampleMR包筛选工具变量SNP,以P < 5×10
-8为显著性阈值,连锁不平衡阈值r
2 < 0.001(10,000 KB窗口),F统计量>10以排除弱工具变量,并去除回文结构SNP。分析采用IVW、加权中位数、MR-Egger回归、简单模态和加权模态五种MR方法,应用FDR校正,并通过Cochran's Q检验、MR-Egger截距、MR-PRESSO检验和留一法分析进行敏感性分析,评估异质性和水平多效性。反向MR分析以宫颈癌为暴露、七种显著相关血浆蛋白为结局,采用P < 5×10
-6的SNP筛选阈值。最终通过clusterProfiler包进行GO和KEGG通路富集分析,并用GeneMANIA构建蛋白质-蛋白质相互作用网络。
正向MR分析结果显示,以IVW法结合FDR < 0.2的标准,从4,907种血浆蛋白中鉴定出七种与宫颈癌显著相关的蛋白表型。DEFB135(OR = 0.201,95% CI = 0.082–0.492)、FGL2(OR = 0.104,95% CI = 0.032–0.338)、FTMT(OR = 0.612,95% CI = 0.465–0.804)、PDIA4(OR = 0.088,95% CI = 0.026–0.295)、SPHK2(OR = 0.102,95% CI = 0.030–0.350)和TMED2(OR = 0.045,95% CI = 0.008–0.246)与宫颈癌呈负相关,提示潜在保护作用;RACGAP1(OR = 1.755,95% CI = 1.286–2.395)与宫颈癌呈正相关,提示促进疾病发生的作用。这些结果经MR-Egger回归、加权中位数及简单/加权模态方法的补充分析所支持,火山图直观展示了关联的强度和显著性。敏感性分析方面,Cochran's Q检验显示七种蛋白的P值均大于0.05,表明无异质性;Egger截距检验P值大于0.05,提示无水平多效性影响;MR-PRESSO方法进一步确认了MR结果的可靠性;留一法分析显示研究结果不依赖于任何单个SNP。反向MR分析的IVW结果显示,TMED2、FGL2、SPHK2、DEFB135、PDIA4、FTMT和RACGAP1对宫颈癌风险均无显著因果效应(所有P > 0.05),其他MR方法亦未产生统计学显著的因果估计值,不支持这些血浆蛋白与宫颈癌之间存在反向因果关系。反向MR的敏感性分析中,Cochran's Q检验P值<0.05提示存在异质性,可能归因于遗传变异对表型的影响及人群特异性遗传背景,通过多途径介导;采用随机效应IVW分析可部分处理观察到的异质性,而Egger截距和MR-PRESSO全局检验P值大于0.05则表明无水平多效性证据。
GO分析显示,疾病相关血浆蛋白在生物学过程(BP)、细胞组分(CC)和分子功能(MF)中均有显著富集。BP主要涉及细胞器定位的建立和氧化还原酶活性的调节;CC富集于酶原颗粒膜、COPI包被囊泡膜、酶原颗粒、COPI包被囊泡、Flemming体、纺锤体中区、分裂沟、高尔基体相关囊泡膜、ER到高尔基体转运囊泡膜和细胞分裂位点等;MF富集包括三价铁离子结合、氧化还原酶活性(作用于金属离子)、生物活性脂质受体活性、蛋白质二硫键异构酶活性、分子内氧化还原酶活性(转置S-S键)、二价铁离子结合、蛋白质二硫键还原酶活性、γ-微管蛋白结合、frizzled结合和磷脂酰肌醇-3,4,5-三磷酸结合等功能。KEGG通路富集分析揭示这些蛋白主要参与铁死亡(Ferroptosis)、卟啉代谢、霍乱弧菌感染、鞘脂代谢、VEGF信号通路、甲状腺激素合成、FcγR介导的吞噬作用、鞘脂信号通路和Apelin信号通路等,其中铁死亡具有最高的统计学置信度(P < 0.01)。GeneMANIA网络分析显示七种血浆蛋白表型基因位于网络中心,与周围基因形成密集的功能交互网络,其中共表达占92.52%,预测相互作用占7.48%。
讨论部分,研究人员首先指出本研究的三个主要优势:利用最大规模的蛋白质组学GWAS数据库的pQTL数据、MR设计有效减少混杂和反向因果风险、应用FDR校正并优先选择OR方向一致的蛋白以增强可靠性。随后详细讨论了各鉴定蛋白的功能机制:DEFB135编码防御素β135,是一种在调节免疫应答和炎症中起关键作用的抗菌肽,主要表达于人体上皮组织,HPV介导的DEFB135表达下调可能削弱宿主免疫防御;FGL2(纤维蛋白原样蛋白2)具有凝血酶原活性和多种免疫调节功能,在肿瘤微环境中促进巨噬细胞极化和调节性T细胞增殖以增强免疫抑制活性,但本研究发现其可能对宫颈癌具有保护作用;FTMT(线粒体铁蛋白)优先表达于高代谢活性和缺氧环境的细胞中,通过螯合铁离子和减轻氧化损伤发挥功能,HPV感染升高细胞内氧化应激,FTMT可能通过减少活性氧(ROS)诱导的DNA损伤而抑制癌变;PDIA4(蛋白质二硫键异构酶A4)是内质网驻留蛋白,在蛋白质折叠和二硫键形成中起关键作用,其在肿瘤组织中的异常过表达与较差临床结局相关,但胚系预测的血浆PDIA4水平可能反映固有的保护性全身调节状态;SPHK2(鞘氨醇激酶2)通过调节细胞内鞘氨醇-1-磷酸(S1P)水平影响细胞生长、存活和迁移,其过表达与宫颈癌侵袭性增强和治疗抵抗相关,但早期研究也提示其可能通过BH3结构域诱导凋亡而具有促凋亡和抗癌特性;TMED2(跨膜p24转运蛋白2)是细胞质内囊泡蛋白运输的关键调节因子,在乳腺癌、头颈部鳞状细胞癌等多种恶性肿瘤中过表达并与不良预后相关,但本研究提示其可能对宫颈癌具有保护作用;RACGAP1(Rac GTP酶激活蛋白1)通过调节Rac1和Cdc42信号驱动肿瘤进展,可通过miR-192调节c-Jun表达,进而通过p-JNK磷酸化激活AP-1促进宫颈癌细胞的增殖、迁移和侵袭,还可通过调控CDC25C加速细胞周期进程,并与FOXM1协同抑制PI3K/AKT信号通路介导的凋亡。
研究局限性包括:样本量较小可能降低统计效能和估计精度,增加对工具变量有效性假设的敏感性,减弱敏感性分析的可靠性,限制结果的可重复性,并放大弱工具变量偏倚;分析仅限于欧洲人群,缺乏其他种族代表性,可能引入估计偏倚并限制结果的外推性;富集分析作为预测工具,其准确性有待进一步验证,需进行组织特异性表达研究和体内实验等功能验证以确认这些蛋白作为生物标志物或治疗靶点的作用。
研究结论:DEFB135、FGL2、FTMT、PDIA4、SPHK2和TMED2可能对宫颈癌具有保护作用,而RACGAP1可能促进疾病发病机制。这些发现为识别宫颈癌的潜在生物标志物和治疗靶点提供了坚实的理论基础,为进一步的机制性和临床研究开辟了新途径。