《Journal of Chromatography B》:Comprehensive urinary proteomics using DIA and PRM for low-abundance protein profiling of Wilson disease
编辑推荐:
威尔逊病尿液中低丰度蛋白检测采用DIA-PRM联用技术优化蛋白质组学分析,发现46个候选生物标志物,经SVM模型筛选和ELISA验证后确定11个标志物,建立高精度(ROC AUC 0.95)非侵入性诊断模型。
周慧玲|董思敏|潘奥|徐焕|唐欣|王茜茜|谢林深|李永新
四川大学西部公共卫生学院和西部第四医院,成都610041,中国
摘要
威尔逊病(WD)是一种遗传性的铜代谢紊乱疾病,早期诊断具有挑战性。尿液蛋白质组学在识别与WD相关的生物标志物方面显示出潜力,但目前的策略忽略了对于临床前诊断至关重要的低丰度蛋白质的检测。本研究使用一种优化的蛋白质组学策略分析了53名新诊断的WD患者和47名匹配对照组的尿液样本,该策略结合了数据独立获取(DIA)和并行反应监测(PRM)。通过功能富集分析、层次聚类和其他多维分析方法来探究低丰度蛋白质生物标志物。应用递归特征消除(RFE)和支持向量机(SVM)来识别候选生物标志物,并通过接收者操作特征(ROC)曲线评估诊断模型的性能。此外,还在独立验证队列中通过ELISA验证了这些潜在的生物标志物。基于DIA的优化无靶蛋白质组学分析鉴定了2263种尿液蛋白质,其中包括447种差异表达的蛋白质(68种上调和379种下调)。经过LC-PRM-MS验证后,确定了46个新的WD候选生物标志物,其中11个被纳入最终模型。SVM模型在区分WD患者和健康对照组方面表现最佳,训练集和测试集的ROC曲线下面积分别为0.95和0.94。在独立队列中通过ELISA验证的4种蛋白质的表达水平与蛋白质组学数据一致。所提出的DIA-PRM蛋白质组学方法能够检测到更多的低丰度尿液蛋白质,并识别出一组具有高准确性的WD患者非侵入性诊断生物标志物。
引言
威尔逊病(WD)是一种由ATP7B基因突变引起的常染色体隐性铜代谢紊乱疾病,表现为肝功能异常、神经系统异常和其他系统并发症[1,2]。该疾病通常在儿童的第二十年发病,在儿童中的发病率男女相当[3],全球发病率约为每30,000人中有1例[4]。最近的全基因组测序和荟萃分析研究表明,由于误诊和漏诊,WD的遗传发病率可能被低估了[[5], [6], [7]]。目前,WD患者的诊断是通过结合临床特征、铜蓝蛋白、24小时尿铜、Kayser-Fleischer环、基因分型和肝活检等综合评估来确定的[8]。然而,这些指标的敏感性和特异性有限,并且存在侵入性操作的风险[[9], [10], [11], [12]]。尽管新兴的非侵入性方法(如放射性铜结合试验和相对可交换铜(REC)显示出诊断潜力,但它们不适用于常规临床应用,且依赖于晚期肝功能异常的指标[[13], [14], [15], [16]]。因此,迫切需要能够可靠地在早期阶段检测出WD患者的敏感、非侵入性生物标志物。
蛋白质组学分析已成为发现许多神经系统和肝脏疾病生物标志物的强大工具,包括帕金森病[17]、阿尔茨海默病[18]、肝炎[19]和肝细胞癌[20]。蛋白质表达的变化通常在出现明显症状之前就已经发生[21],这突显了蛋白质组学在早期识别疾病特异性生物标志物方面的价值。然而,在各种疾病的初始阶段,与病理变化相关的蛋白质在体液或组织中的浓度通常极低[22],这对传统检测方法来说是一个挑战。此外,生物样本中蛋白质浓度的动态范围很广。人类血浆蛋白质的浓度大约跨越12-13个数量级[23],而大多数当前分析方法的能力仅限于4-5个数量级[22,24,25]。与血液样本相比,尿液是一种非侵入性样本,其蛋白质的动态范围较小,更适合检测低丰度蛋白质(LAPs)[26]。另外,血液受到稳态机制的严格调控,因此通常只有在疾病后期才会观察到显著变化。相比之下,尿液受此类调控的影响较小,为检测早期和敏感的生物标志物提供了有利条件。
目前,减少尿液样本中LAPs检测难度的主要策略包括免疫亲和富集[27]、分级分离[28]和特定蛋白质的富集[29],但这些方法操作复杂且耗时。免疫亲和富集可能导致非特异性结合,去除目标蛋白质并影响LAPs的准确检测[30,31]。随着质谱(MS)技术的发展,无偏地识别LAPs和深入的蛋白质组学分析成为可能。MS的数据获取可以通过数据依赖获取(DDA)和数据独立获取(DIA)来实现。在我们之前的工作中,通过DDA鉴定了五种威尔逊病的候选蛋白质生物标志物[32]。然而,WD患者和健康对照组之间存在大量重叠,这表明需要新的蛋白质组学方法来优化生物标志物面板。与DDA相比,DIA系统地获取预定义质量范围内所有离子的完整碎片谱,确保了全面的光谱获取并最小化了数据丢失[33]。此外,DIA减轻了DDA固有的采样偏差,从而提高了蛋白质定量? ???和重复性[34]。结合离子迁移率分离,这种方法可以增强检测深度,更适用于尿液样本中LAPs的分析[35]。
现代蛋白质组学策略有助于开发组合生物标志物面板,其诊断性能优于单个生物标志物[36]。为了基于LAPs开发生物标志物面板,我们使用DIA对WD患者和健康对照组进行了全面的尿液蛋白质组学分析。通过优化液相色谱梯度和质量谱参数,实现了更高的蛋白质识别深度和精度,从而便于检测LAPs并发现新的WD尿液生物标志物候选物。在使用并行反应监测(PRM)验证后,应用递归特征消除方法确定了最佳的尿液蛋白质生物标志物组合,随后使用这些标志物开发了一个基于支持向量机(SVM)的WD诊断模型。这些生物标志物在独立队列中通过ELISA进一步得到了验证。据我们所知,这是首次将DIA与PRM结合用于WD尿液蛋白质组学研究,并使用基于机器学习的特征选择方法证明了强大的非侵入性诊断性能。
章节片段
化学物质和试剂
LC-MS级别的甲醇、乙腈和甲酸购自Thermo Fisher Scientific(美国马萨诸塞州沃尔瑟姆)。微肌酐和Bradford蛋白测定试剂盒分别来自Sangon Biotech(中国上海)和Beyotime Biotechnology(中国上海)。胰蛋白酶(测序级)购自Promega(美国威斯康星州麦迪逊)。肽和Hela细胞消化标准品来自Qiangyao Biotechnology(中国苏州)和Thermo Fisher Scientific(美国马萨诸塞州沃尔瑟姆)。LC梯度和MS参数的优化
使用实时PaSER搜索在DDA模式下对混合尿液样本进行了分析,以优化LC-MS条件。比较了三种LC梯度(图1A–C)和两个离子迁移率范围(0.75–1.40 vs 0.85–1.30 Vs/cm2)。随着液相色谱梯度时间的增加,蛋白质检测覆盖率和鉴定数量也随之增加(表S4)。与20分钟梯度相比,60分钟梯度额外鉴定了约400种蛋白质,而进一步延长至120分钟仅增加了约100种蛋白质。讨论
低丰度蛋白质可以作为铜代谢紊乱或组织特异性损伤的早期标志物,从而实现威尔逊病的更精确早期诊断。结合离子迁移率和非依赖数据获取以及优化的仪器条件显著提高了低丰度蛋白质检测的敏感性[37]。因此,在本研究中,我们采用了优化的DIA蛋白质组学技术来提高蛋白质检测覆盖率。十一种与WD相关的尿液生物标志物被识别出来
结论
在这项研究中,我们建立了一种优化的DIA-PRM蛋白质组学工作流程,显著提高了威尔逊病中低丰度尿液蛋白质的检测能力。我们的方法鉴定了46个新的候选生物标志物,其中11个被纳入一个基于SVM的强大诊断模型中,该模型在训练集和测试集的ROC曲线下面积分别为0.95和0.94。在独立队列中的ELISA验证证实了这些生物标志物的一致性
CRediT作者贡献声明
周慧玲:撰写——原始草稿,可视化,数据管理,概念构思。董思敏:撰写——原始草稿,软件开发,概念构思。潘奥:可视化,验证,方法学。徐焕:软件开发,方法学,研究。唐欣:验证,方法学,研究。王茜茜:可视化,验证,监督。谢林深:可视化,项目管理,方法学。李永新:撰写——审稿与编辑,项目管理,资金支持
资助
本工作得到了四川省科学技术厅(编号:2021YFS0182)的支持。
利益冲突声明
作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。