《Atherosclerosis》:Clinical Proteomics in Cardiovascular Medicine: Current Capabilities, Limitations, and Future Directions
编辑推荐:
本综述深入探讨了Olink与SomaLogic等高通量蛋白质组学平台在动脉粥样硬化性心血管疾病(ASCVD)研究中的应用与挑战。文章强调,尽管人工智能(AI)驱动的多组学分析有望揭示疾病机制并推动“液体健康检查”的临床转化,但平台间数据相关性有限、表位效应及交叉反应性等问题制约了其发展。未来需依靠绝对定量、正交验证以及生成式AI(GenAI)合成数据等技术,确保蛋白质测量质量而非数量,最终实现精准医疗。
引言
尽管我们对动脉粥样硬化性心血管疾病(ASCVD)的理解和治疗取得了重大进展,但缺血性心脏病和卒中仍是全球首要死因。前蛋白转化酶枯草溶菌素9(PCSK9)是一个典型案例,其从基因发现到新药PCSK9抑制剂获批仅用了12年。面对ASCVD的异质性,多组学技术(基因组学、转录组学、蛋白质组学、代谢组学)与人工智能(AI)的结合,正推动着精准医学的发展。蛋白质组学因其最接近生理活动和组织损伤,在组学层中占据核心地位。本综述旨在审视商业蛋白质组学平台的数据质量,探讨血浆与组织蛋白质组学的互补性,并展望生成式AI(GenAI)如何使蛋白质组学数据更易获取、可解释且公平。
血浆蛋白质组学揭示器官衰老特征
衰老是ASCVD的主要风险因素。血压和血糖水平随年龄线性上升即是明证。新兴的“年龄型”概念,即通过AI和蛋白质组学定义的器官特异性生物钟,使得个性化监测和靶向干预成为可能。研究表明,个体衰老模式不同,甚至同一人体内各器官的衰老进程也不同,可能存在单器官加速衰老或多器官衰老。
对小鼠的异时共生实验表明,循环因子可能影响机体衰老。基于苏玛扫描(SomaScan)v.4平台(约5000种蛋白质)和Olink Explore 3072平台(约3000种蛋白质)的大规模研究,已成功构建了心脏等器官的特异性衰老模型。加速的心脏衰老与心衰风险增加显著相关,而心房颤动或心脏病发作患者的“心脏年龄”比同龄人老约3岁。值得注意的是,心肌梗死等疾病与几乎所有器官的加速衰老都有关联。
在这些研究中,脑钠肽前体(NPPB)和肌钙蛋白I(TNNI3)是心脏衰老蛋白质特征中共同出现的标志物。基于基因型-组织表达(GTEx)数据库的转录组学分析显示,虽然68%的人类蛋白质在心脏中表达,但仅有2%是心脏富集的。骨形态发生蛋白10(BMP10)和过氧化物酶样蛋白(PXDNL)也在不同平台的研究中被共同识别。这些标志物的一致性提示了亚临床心脏疾病的存在,值得深入研究。
动脉粥样硬化性心血管疾病(ASCVD)的血浆蛋白质特征
传统的ASCVD风险预测存在局限性。研究表明,血浆蛋白质组学特征可以改善ASCVD预测。例如,一项研究利用苏玛扫描(SomaScan)平台和机器学习,推导出一个27蛋白质模型,其预测4年内心肌梗死、心衰、卒中或死亡的风险优于临床模型。然而,不同研究确定的蛋白质标志物重叠有限。例如,两项基于苏玛扫描(SomaScan)的研究仅有6个蛋白质重叠,而当扩展到Olink平台时,仅剩NPPB/N末端B型利钠肽原(NT-proBNP)和基质金属蛋白酶12(MMP12)保持一致。
这种差异部分源于平台间的相关性有限。研究表明,苏玛扫描(SomaScan)和Olink平台之间的斯皮尔曼相关系数中位数仅为0.33左右。低丰度蛋白质的相关性更差。此外,平台特异性问题,如表位效应,可能导致同一蛋白质的蛋白质定量性状位点(pQTL)不同,从而混淆因果推断。通过结合cis-pQTL的存在和平台间相关性,研究认为在1848个共同测量的蛋白质中,仅有约30%(551个)可以被认为是高置信度测量。
值得注意的是,载脂蛋白B(ApoB)和脂蛋白(a)[Lp(a)]等明确的ASCVD靶点并未在基于亲和力的蛋白质组学平台中被一致识别,部分原因是这些平台对两亲性载脂蛋白的测量效果不佳。相比之下,基于质谱的蛋白质组学能更直接地定量多肽丰度,在精准测量脂蛋白残粒风险和治疗反应方面显示出潜力。
斑块多组学揭示分子机制
作为血浆蛋白质组学的补充,组织蛋白质组学可以发现可能释放到血液中的斑块特异性蛋白质。基于颈动脉内膜切除术样本的研究,通过整合蛋白质组学和转录组学,识别出与斑块不稳定性相关的4种生物标志物:基质金属蛋白酶9(MMP-9)、组织蛋白酶D、钙卫蛋白(S100A8/S100A9)和半乳糖凝集素-3结合蛋白。空间转录组学证实了MMP-9在易破裂颈动脉斑块区域的上调。
斑块蛋白质组在不同区域(如富含脂质的坏死核心与纤维帽)存在显著差异。蛋白质组学正从整体组织分析向斑块亚区、微域乃至空间和单细胞蛋白质组学过渡,这将为了解细胞异质性提供关键信息。然而,依赖尸检样本会因蛋白质降解而导致定量不可靠。单细胞转录组学揭示了症状性患者斑块中T细胞和巨噬细胞的独特特征,但样本量小和可能的RNA降解是需要关注的问题。
脂质组学分析显示,与对照动脉相比,斑块中多不饱和脂肪酸减少,而亚油酸增多。基质辅助激光解吸/电离质谱成像(MALDI-MSI)技术展示了特定脂质类别与斑块特征的共定位。
未来方向:利用生成式AI(GenAI)实现组学公平
蛋白质组学的未来充满希望。制药蛋白质组学计划(PPP)等大型项目正推动蛋白质组学在新药靶点发现中的应用。临床试验中的蛋白质组学可以为疾病机制和药物重定位提供见解。
为了促进数据共享的公平性,同时保护患者隐私,生成式AI(GenAI)被用于生成合成数据。生成对抗网络(GANs)等框架可以学习真实数据的底层分布,创造出统计特性相似但全新的合成数据。联邦学习与GenAI结合,有望实现隐私保护下的多中心协作。然而,合成数据会继承真实数据的偏差,需要严格的质量控制以确保其可靠性和临床合理性。
结论
随着蛋白质组学和AI技术的进步,未来利用一滴血进行多蛋白标志物筛查的“液体健康检查”有望成为现实。然而,其临床实现有赖于蛋白质组学平台能够提供成本效益高的绝对定量或高度可重复的相对定量,并建立明确的临床判定阈值。除了风险预测,蛋白质组学更应被用于探索疾病通路。最终,决定蛋白质组学临床价值的是测量质量,而非数量。