《Talanta》:A Low-Cell-Number Proteomics Method for Elucidating the Developmental Mechanisms of Colorectal Cancer Stem Cells
编辑推荐:
结直肠癌干细胞(CCSCs)恶性进展及耐药机制研究采用低细胞数多组学平台(LCNP-T-M),通过优化样品前处理和质谱参数,从<1000细胞中鉴定出5774-5992个蛋白质,发现ROCK1、PPP2R5A等7个关键调控因子,其表达动态变化与CCSCs诱导阶段相关,为靶向治疗提供新思路。
陈天|李博业|周思农|张文梅|王梦颖|赵伟健|王霞燕
北京工业大学化学与生命科学学院化学系,环境安全与生物效应卓越中心,材料低碳循环国家重点实验室,北京 100124,中国
摘要
结直肠癌(CRC)是全球主要的死亡原因之一。结直肠癌干细胞(CCSCs)是一类关键且稀有的细胞亚群,它们驱动着肿瘤的恶性进展、治疗抵抗性和复发。了解CCSCs的发育机制对于阐明肿瘤演化和识别潜在的治疗靶点至关重要。蛋白质组学作为一种高通量蛋白质检测方法,已被广泛用于研究肿瘤的发生和发展机制。然而,由于CCSCs数量稀少,获取足够数量的连续样本以进行传统的蛋白质组学研究颇具挑战性。在此,我们构建了一个多组学平台(LCNP-T-M),基于低细胞数量蛋白质组学、转录组学和代谢组学来研究CCSCs的动态发育过程。LCNP技术能够在低输入条件下识别出5,774至5,992种蛋白质,显著提高了蛋白质组的覆盖范围。通过LCNP-T-M平台,我们发现了七个关键的调控因子:ROCK1、PPP2R5A、RHOA、JUN、GCLM、PIK3CB和AK6。实时定量聚合酶链反应(RT-qPCR)显示这些因子在CCSCs诱导过程中具有阶段特异性过表达,并显示出它们作为治疗靶点的潜力。LCNP-T-M平台为研究CCSCs的机制和靶点发现提供了有效的技术框架和理论基础。
引言
结直肠癌(CRC)是全球第二大常见癌症(占9.6%),也是癌症相关死亡的第三大原因(占9.3%)[1]。CRC细胞会随着时间积累突变,从而产生具有干细胞特性的亚群——即结直肠癌干细胞(CCSCs)。研究表明,CCSCs具有自我更新能力和多谱系分化潜能。这些细胞推动了肿瘤的发生、恶性进展、复发和药物抵抗性[2]、[3]。研究CCSCs的动态发育机制可以揭示精准治疗的新靶点,并帮助克服CRC的药物抵抗性。然而,CCSCs在组织中极为罕见,并且表现出高度的发育异质性。传统的批量细胞分析方法无法捕捉到CCSCs演化过程中的关键分子转变[4]。
随着组学技术的发展,基于质谱的蛋白质组学为系统分析细胞状态和功能提供了强大的工具,并已在生物学和医学研究中得到广泛应用[5]、[6]、[7]。传统的蛋白质组学分析需要200-1,000纳克的肽输入量才能确保足够的蛋白质组覆盖度[8],这在面对CCSCs等稀有样本时会导致蛋白质组深度和定量准确性的显著限制。最近在低输入量和单细胞蛋白质组学技术方面的进展使得高灵敏度的蛋白质组学分析成为可能[9]、[10]、[11]。这些创新包括固相增强样品制备(SP3)[12]、微流控纳升级系统[13]、等压标记方法(如串联质量标签TMT)[14]、[15]以及单细胞蛋白质组学技术,这些技术使得蛋白质组学能够在低输入量和高灵敏度的条件下进行[16]、[17]。尽管灵敏度和适用性得到了提升,但这些技术仍面临一些挑战,包括操作复杂性、专用设备限制、高成本和有限的通量。这些限制阻碍了在少量细胞研究中实现高蛋白质组覆盖度和通量[18]、[19]、[20]。
在此,我们构建了一个多组学平台(LCNP-T-M),基于低细胞数量蛋白质组学、转录组学和代谢组学来研究CCSCs的动态发育过程。通过简化样品处理、减少转移损失以及优化色谱梯度和质谱采集参数,LCNP技术能够在少于1,000个细胞(肽浓度为12.5-200纳克)的情况下稳定识别出5,774-5,992种蛋白质。随后,我们应用LCNP-T-M对CCSCs从第0天到第9天的动态发育过程进行了蛋白质组分析。在CCSCs的演化过程中,发现了七个关键的调控因子:ROCK1、PPP2R5A、RHOA、JUN、GCLM、PIK3CB和AK6。实时定量聚合酶链反应(RT-qPCR)显示这些因子在CCSCs诱导过程中具有阶段特异性过表达,并显示出它们作为治疗靶点的潜力。此外,LCNP-T-M平台为研究CCSCs的机制和靶点发现提供了有效的技术框架和理论基础。
材料与试剂
脱氧胆酸钠(SDC)、碳酸氢铵(NH4HCO3)、2-氯乙酰胺(CAA)、胰岛素、苯乙烯二乙烯基苯磺酸盐(SDB-RPS)色谱柱尖端以及Tris(2-羧乙基)膦(TCEP)均购自Sigma-Aldrich(美国)。胰蛋白酶/Lys-C混合物(MS级)购自Promega(美国)。乙腈(ACN)、甲酸(FA)、水(MS级)、磷酸盐缓冲盐水(PBS)、Dulbecco改良Eagle培养基(DMEM)、胎牛血清(FBS)、青霉素-链霉素(P/S)
LCNP-T-M平台
我们构建了一个基于低细胞数量蛋白质组学、转录组学和代谢组学(LCNP-T-M)的多组学平台。该平台采用快速、低损失的样品制备方法和优化的LC-MS/MS参数,能够从少于1,000个细胞中识别出超过5,900种蛋白质,从而克服了传统蛋白质组学方法在分析CCSCs这类稀有细胞亚群时的局限性(见图1)。
将该平台应用于不同时间点收集的CCSCs样本(D0、D3、D6和D9),揭示了早期阶段的...
结论
在这项研究中,我们建立了一种新的蛋白质鉴定方法(LCNP),能够在少于1,000个细胞中识别蛋白质。通过优化快速样品处理、一步脱盐和LC-MS/MS参数,该方法成功识别出约6,000种蛋白质,从而克服了稀有细胞群体在蛋白质组覆盖度和重复性方面的关键障碍。将该方法应用于CCSCs的诱导过程,系统地描述了动态蛋白质组的重塑情况。
CRediT作者贡献声明
周思农:验证、方法学。李博业:可视化、验证、方法学、研究。陈天:撰写——初稿、可视化、验证、方法学、研究。王霞燕:撰写——审稿与编辑、监督、方法学、概念化。赵伟健:撰写——审稿与编辑、验证、监督、方法学。王梦颖:验证、方法学。张文梅:验证、方法学
利益冲突声明
? 作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:王霞燕报告获得了国家自然科学基金的支持;王霞燕还获得了北京市杰出青年科学家的资助。如果还有其他作者,他们声明没有已知的可能影响研究的财务利益或个人关系。
致谢
作者感谢北京工业大学的秦虎博士提供的技术支持和有益的讨论。本工作得到了国家自然科学基金(项目编号22127805)和北京市杰出青年科学家计划(项目编号BJJWZYJH01201910005017)的资助。