-
生物通官微
陪你抓住生命科技
跳动的脉搏
SNP与抗体分选技术(SNACS):单细胞DNA测序数据解卷积的新工具及其在白血病研究中的应用
《Bioinformatics》:Single Nucleotide Polymorphism (SNP) and Antibody-based Cell Sorting (SNACS): A tool for demultiplexing single-cell DNA sequencing data
【字体: 大 中 小 】 时间:2025年06月06日 来源:Bioinformatics 4.4
编辑推荐:
本研究针对单细胞DNA测序(scDNA-seq)多样本混合实验的解卷积难题,开发了结合单核苷酸多态性(SNP)和抗体标记(SNACS)的创新算法。通过白血病患者样本验证,SNACS解卷积准确率达0.948-0.991,显著优于现有方法。该技术为大规模癌症异质性研究提供了高效解决方案,相关成果发表于《Bioinformatics》。
在癌症研究领域,单细胞DNA测序(scDNA-seq)技术近年来带来了革命性突破,能够揭示肿瘤内部的遗传异质性和克隆进化过程。然而这项技术面临着一个关键瓶颈:当研究人员试图扩大研究规模,将多个患者样本混合检测时,如何准确地将测序数据重新"归位"到原始样本成为重大挑战。现有解卷积方法主要针对单细胞RNA测序(scRNA-seq)设计,在DNA测序数据中表现欠佳,准确率最低仅0.552,这严重限制了该技术在临床研究和大规模队列中的应用价值。
针对这一技术瓶颈,斯坦福大学和加州大学旧金山分校的研究团队开发了一种名为SNACS(SNP和抗体分选技术)的创新解决方案。这项研究巧妙结合了两种信息源:一是每个患者独特的遗传指纹——单核苷酸多态性(SNP),二是通过抗体标记技术为每个样本添加的人工"条形码"。就像给图书馆的每本书同时贴上RFID标签和记录独特的磨损特征,双重验证确保了更高的分类准确性。相关研究成果发表在生物信息学顶级期刊《Bioinformatics》上。
研究团队采用了几个关键技术方法:首先利用微流控平台(Tapestri)进行单细胞捕获和测序;其次开发了基于层次聚类和环形二元分割(CBS)的算法流程;最后通过模拟数据和真实白血病患者样本(8例初筛队列+4例验证队列)进行验证。特别值得注意的是,研究设计了严谨的"金标准"验证体系,通过对比混合样本与单独测序样本的SNP谱来评估算法准确性。
研究结果部分展示了系统的验证过程:
"算法设计"部分详细阐述了SNACS的三步工作流程:首先利用抗体信号进行初步分类;然后筛选最具区分度的SNP位点;最后通过层次聚类和抗体信号验证完成最终分类。这种方法创新性地实现了遗传信息与蛋白标记的协同利用。
"系统与方法"部分介绍了研究采用的实验体系。通过11个scDAb-seq实验(7个开发集+4个验证集),使用288个AML相关基因的靶向panel,获得了70,476个SNP位点的数据。特别设计了单样本实验作为"金标准",为算法评估提供真实基准。
"实证数据性能"部分显示,在2-4个样本混合实验中,SNACS的准确率达到0.948-0.991,显著优于现有方法。例如在患者A+B混合实验中,SNACS准确率0.991,而表现次优的Robinson方法仅0.934。更重要的是,SNACS保留了95%以上的输入细胞,过滤率显著低于其他方法。
"独立验证队列"部分将SNACS扩展到8个样本混合场景。虽然技术上可行,但研究发现当样本数超过4个时,每个样本获得的细胞数可能低于500个,提示存在实际应用限制。模拟数据表明,将输入细胞数提高10倍可缓解这一问题。
"缺失数据耐受性"测试显示,SNACS在缺失数据达40%时仍保持良好性能,超过这一阈值时算法会发出警告,体现了良好的鲁棒性。
研究结论部分指出,SNACS成功解决了scDNA-seq多样本混合实验的解卷积难题,其创新性主要体现在三个方面:一是首次将SNP与抗体标记结合使用;二是开发了适应DNA测序特点的算法流程;三是建立了严格的验证体系。相比现有方法,SNACS在保持高细胞保留率的同时,将准确率提高了5.8%-43.9%。
讨论部分深入分析了技术优势和应用前景。研究者特别指出,虽然SNACS主要针对跨样本多重检测(across-sample multiplets),但结合doubletD算法后也可能识别样本内多重检测(within-sample multiplets)。研究也坦诚技术局限,包括对罕见细胞群体的潜在错误分类,以及样本数超过4个时的实用性挑战。
这项研究的临床意义尤为突出。以白血病为例,能够同时分析多个患者的肿瘤克隆演化,对理解治疗耐药机制至关重要。研究团队已将该技术应用于混合表型急性白血病(MPAL)研究,成功解析了干性特征(Peretz et al., 2024)。随着单细胞技术的普及,SNACS有望成为癌症研究和临床检测的标准工具之一。
未来发展方向包括:优化靶向panel设计,纳入更多人群高频SNP位点;拓展到其他癌症类型;与表观遗传等组学数据整合。研究团队已公开所有代码和数据,体现了科学共享精神。这项研究不仅解决了具体的技术难题,更为单细胞多组学研究的规模化应用开辟了新途径。