
-
生物通官微
陪你抓住生命科技
跳动的脉搏
"Cell Marker Accordion:单细胞与空间组学注释新工具在健康与疾病研究中的突破性应用"
【字体: 大 中 小 】 时间:2025年07月08日 来源:Nature Communications 14.7
编辑推荐:
单细胞技术虽能解析细胞异质性,但现有注释工具存在标记基因不一致、命名不统一、疾病细胞识别不足等问题。研究团队开发了Cell Marker Accordion平台,通过整合23个标记数据库、引入证据一致性评分(ECs)和特异性评分(SPs),在9个单细胞/空间数据集验证中平均提升23%注释准确率,并能识别AML中LHSCs(白血病造血干细胞)等疾病关键细胞,为病理机制研究和生物标志物发现提供标准化工具。
在生命科学领域,单细胞RNA测序(scRNA-seq)和空间组学技术正以前所未有的分辨率揭示着细胞异质性的奥秘。然而,当科学家们试图解读这些海量数据时,却面临着一个令人头疼的"身份危机"——如何准确识别每个细胞的类型和状态?现有工具不仅使用互不相同的标记基因,导致注释结果大相径庭,更棘手的是它们大多只关注正常生理状态下的细胞类型,对疾病相关细胞的识别能力捉襟见肘。这种混乱局面严重阻碍了从单细胞数据中挖掘生物学意义的进程,特别是在肿瘤微环境、治疗抵抗等关键医学问题的研究中。
针对这一挑战,来自意大利特伦托大学和美国耶鲁大学医学院的研究团队在《Nature Communications》发表了突破性解决方案。他们开发的Cell Marker Accordion平台,犹如一位精通细胞"语言"的翻译官,通过整合23个已发表的标记数据库,建立了包含15,479个人类标记基因和4,118个小鼠标记基因的标准化资源库。这个工具最精妙之处在于引入了两项创新指标:证据一致性评分(ECs)衡量不同来源对同一标记的认可程度,特异性评分(SPs)评估标记基因的专一性。这种双重加权机制使细胞注释既全面又精准,就像为细胞身份加装了"双重验证系统"。
研究团队采用多组学验证策略,首先对93456个荧光激活细胞分选(FACS)血液细胞进行分析,结果显示Cell Marker Accordion的注释准确率显著优于ScType等5种现有工具。在空间转录组应用中,该工具成功解析了37,068个小鼠脑细胞的空间分布,准确率提升13%。更令人振奋的是,在急性髓系白血病(AML)患者数据中,该平台不仅识别出常规的白血病干细胞(LHSCs),还捕捉到 Venetoclax治疗后的耐药性单核细胞群体,这些细胞在复发时依然"顽固"存在,为理解治疗失败机制提供了新线索。
技术方法上,研究整合了单细胞RNA测序、CITE-seq(同时检测RNA和表面蛋白)、MERFISH(多重误差鲁棒荧光原位杂交)等前沿技术。人类骨髓样本来自耶鲁大学经伦理批准的MDS患者队列(5例野生型,3例U2AF1 S34F突变型),小鼠模型则采用METTL3条件性敲除和STM2457药物抑制实验。
研究结果部分,《Widespread heterogeneity across annotation sources leads to inconsistent cell type annotation》揭示现有数据库间标记基因重叠率低至8%,导致"自然杀伤细胞"与"NK细胞"等命名混乱。《The Cell Marker Accordion: a user-friendly platform》展示该工具通过加权算法,在骨髓数据集将注释性能提升23%。《The Cell Marker Accordion identifies disease-critical cells》部分发现AML患者中LHSCs评分在 Venetoclax治疗后归零,而异常单核细胞持续存在,印证了后者是耐药"元凶"。《Altered cell type composition in SF mutant MDS》通过62,496个细胞测序,揭示U2AF1 S34F突变导致红系分化阻滞。《Activation of innate immunity pathways》则发现METTL3缺失会激活干扰素通路,这与内源性双链RNA形成机制相符。
这项研究的里程碑意义在于,它首次建立了兼顾广度和深度的细胞注释标准体系。就像为单细胞研究领域谱写了一部权威的"细胞词典",Cell Marker Accordion不仅解决了注释混乱的燃眉之急,其疾病模块更能识别肿瘤干细胞等"危险分子",为精准医疗提供新靶点。该工具已开源共享,其模块化设计也预留了对接染色质可及性(spATAC-seq)等新兴技术的接口。随着空间组学时代的到来,这种能够同时解析"细胞身份"和"细胞住址"的工具,必将成为探索生命奥秘的必备"导航仪"。
生物通微信公众号
知名企业招聘