
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于安娜·卡列尼娜原理的RNA-seq去卷积新策略DECEPTICON:提升肿瘤微环境解析精度的突破性研究
【字体: 大 中 小 】 时间:2025年05月28日 来源:Briefings in Bioinformatics 6.8
编辑推荐:
针对肿瘤微环境细胞组成量化不准确的难题,上海应用技术大学等团队开发了基于安娜·卡列尼娜原理(AKP)的RNA-seq去卷积工具DECEPTICON。该研究整合10种算法与5种表达模板,通过动态选择高相关性策略,在TCGA数据中实现相关性提升23.9%、均方根误差降低73.5%,显著提升乳腺癌(BRCA)、宫颈癌(CESC)等预后分层能力,为精准医疗提供新工具。
肿瘤组织是由恶性细胞、免疫细胞和基质细胞等组成的复杂生态系统,其组成特征直接影响治疗响应和患者预后。尽管流式细胞术等技术能精确量化细胞组成,但成本高且难以普及。近年来,基于转录组数据的计算去卷积方法(如CIBERSORT、EPIC)成为研究热点,但现有方法在异质性数据中表现不稳定,尤其缺乏细胞类型特异性优化策略。
上海应用技术大学材料科学与工程学院Fulan Deng、复旦大学郝杰等团队在《Briefings in Bioinformatics》发表研究,提出创新工具DECEPTICON。受托尔斯泰"安娜·卡列尼娜原理"启发——成功案例具有共性而失败各有不同,研究者假设高精度去卷积结果应呈现方法间高度相关性。通过系统评估50种分析策略(10种算法×5种表达模板),发现最优方法因细胞类型和数据集而异:例如BATMAN算法稳定性最佳,而quan模板对调节性T细胞(Tregs)预测优势显著。
关键技术包括:1)利用scRNA-seq数据构建模拟批量数据集;2)通过最小检测分数(MDF)和背景分数(BF)评估灵敏度;3)采用贝叶斯算法BATMAN首次处理RNA-seq数据;4)基于TCGA的BRCA、CESC和LUAD队列验证预后价值。
研究结果:
模拟数据验证
在包含11,000个细胞的模拟数据中,DECEPTICON平均相关性(r=0.90)显著高于最优单策略(EPIC-TRef r=0.74)。对B细胞和CD8+ T细胞预测误差降低73.5%,且对低丰度Tregs的检测限达2%。
细胞亚型解析
在B细胞亚型分析中,传统方法受噪声干扰严重(SNR=0.1时r<0.3),而DECEPTICON整合的quanTIseq和SCDC策略保持r>0.7,证实其对异质性微环境的解析优势。
真实数据集验证
在头颈鳞癌(HNSCC)和黑色素瘤数据中,DECEPTICON平均相关性达0.91,优于BayesPrism等新兴算法。值得注意的是,在卵巢癌数据中成功捕获到占比<5%的巨噬细胞(r=0.99)。
预后应用
基于TCGA的1,228例乳腺癌分析显示,DECEPTICON计算的B细胞/CD8+ T细胞比值(B-CD8 score)能显著区分患者生存期(P<0.05),而单方法结果波动较大。
结论与意义:
该研究首次将AKP引入计算生物学,创建了可动态适配细胞类型的最优策略选择框架。DECEPTICON的创新性体现在三方面:1)突破传统"一刀切"策略,实现细胞类型特异性优化;2)兼容固定模板与scRNA-seq动态模板;3)开源R包便于临床转化。其成功应用为肿瘤免疫治疗响应预测、微环境演化机制研究提供了可靠工具,未来可通过纳入更多算法进一步提升性能。
生物通微信公众号
知名企业招聘