
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于全基因组测序技术的细胞倍性分析方法性能评估与临床应用展望
【字体: 大 中 小 】 时间:2025年09月10日 来源:Advanced Science 14.1
编辑推荐:
这篇综述系统评估了19种基于全基因组测序(WGS)的倍性(ploidy)分析工具(11种针对批量测序,8种针对单细胞测序),通过实验和模拟数据集验证发现:在肿瘤纯度>30%时,PURPLE算法表现最优;单细胞分析中SeCNV准确性最高。研究揭示了现有工具在低纯度样本、长读长测序(LRS)和整倍体检测中的局限性,为肿瘤基因组不稳定性和临床预后标志物研究提供了方法学指导。
细胞倍性异常是癌症和发育生物学的重要特征。DNA复制错误或染色体分离异常会导致非整倍体(aneuploidy)或全基因组加倍(WGD)。研究显示,约30%人类癌症存在WGD,其通过诱发染色体不稳定性(CIN)促进肿瘤进化。虽然流式细胞术、荧光原位杂交(FISH)等传统技术可用于倍性检测,但基于全基因组测序(WGS)的计算工具能实现更高通量和分辨率。目前缺乏对19种主流工具(11种批量测序、8种单细胞测序)的系统评估,本研究填补了这一空白。
研究采用混合二倍体与多倍体细胞的实验数据集(HCC1395细胞系)和模拟数据集,评估工具在不同测序平台、覆盖度和纯度梯度下的表现。批量测序工具重点评估肿瘤纯度和倍性估计准确性,单细胞工具则专注倍性检测能力。
在11种工具中,PURPLE在肿瘤纯度>30%时表现最优(RMSE<0.2),即使10X测序深度仍保持稳定。ASCAT在纯度≥50%时准确性次之,但存在系统性高估倍性约0.24的偏差。值得注意的是:
低纯度挑战:Accucopy在20%纯度下表现尚可,但稳定性差
整倍体盲区:大多数工具无法区分2N/4N/8N混合样本
长读长困境:PacBio和纳米孔数据尚无工具能准确分析
SeCNV在ACT数据集(2.65N-3.95N)中脱颖而出,平均异常值仅10.8%。而CNVeil虽在scWGA数据(1.7N-3.3N)中表现最佳,但其算法针对该数据集优化,普适性存疑。值得注意的是AneuFinder存在系统性低估倾向。
PURPLE和ASCAT在批量分析中兼具稳定性与效率(100X数据1小时内完成)。单细胞领域,SeCNV虽需更高算力(99细胞/小时),但其准确性优势显著。
研究揭示了三大技术瓶颈:
1)低纯度样本中BAF信号限制算法性能
2)长读长测序(LRS)缺乏专用分析工具
3)WGD样本缺乏突变非依赖的分析策略
采用hTERT RPE-1细胞经单星体(monastrol)诱导获得4N/8N细胞,通过流式分选和DNBSEQ-T7测序构建基准数据集。数据分析采用BWA(短读长)和Minimap2(长读长)比对,变异检测比较了GATK与Strelka流程。
该研究为肿瘤基因组学、发育生物学等领域提供了方法选择指南,并指明了算法开发的未来方向——特别是针对液体活检和长读长测序的应用优化。
生物通微信公众号
知名企业招聘