突破免疫微环境解析难题:创新方法助力癌症免疫治疗研究

《BMC Cancer》:Unveiling the immune microenvironment of complex tissues and tumors in transcriptomics through a deconvolution approach

【字体: 时间:2025年05月02日 来源:BMC Cancer 3.4

编辑推荐:

  在癌症免疫治疗中,准确解析肿瘤浸润白细胞组成至关重要。研究人员开发了由 DOCexpress_fastqc 和 mySORT web 构成的两步工作流程。结果显示,mySORT 预测准确性高且数据可视化功能强大。该研究为免疫治疗提供了有力工具。

癌症,这个医学界的 “头号劲敌”,一直以来让无数科研人员为之绞尽脑汁。它就像一个狡猾的 “敌人”,利用细胞增殖失控的手段,不断侵占身体的 “领地”,还会 “转移阵地”,让病情愈发棘手。近年来,免疫治疗的出现,给癌症治疗带来了新的希望。像免疫检查点蛋白程序性死亡蛋白 1(PD - 1)和细胞毒性 T 淋巴细胞相关蛋白 4(CTLA - 4)通路的发现,开启了癌症治疗的新大门。然而,这扇大门背后却隐藏着诸多挑战。
临床实践中发现,不同患者对免疫治疗的反应差异巨大,有些患者疗效显著,而有些患者却几乎没有效果。研究发现,这种差异可能与肿瘤微环境中免疫细胞的组成密切相关。目前,虽然有流式细胞术和免疫细胞化学等技术,但它们只能基于有限的已知生物标志物进行分析,难以全面解析所有免疫细胞类型。高通量技术如微阵列和下一代测序(NGS)的出现,为估算免疫细胞组成带来了新途径,不过现有的分析方法仍存在诸多不足,比如准确性欠佳,难以精准识别特定免疫细胞类型等。

为了攻克这些难题,来自台北医学大学癌症转化医学研究中心等机构的研究人员开展了一项极具意义的研究。他们致力于开发一种高效的方法,以准确解析肿瘤免疫微环境中的细胞组成,为癌症免疫治疗提供更精准的指导。

研究人员开发了一套包含两个步骤的工作流程。第一步是利用基于 Galaxy/Docker 环境的 DOCexpress_fastqc 工具,它整合了 hisat2 - stringtie 流程和自定义脚本,能对 RNA 测序(RNA - seq)数据进行基因表达谱分析,将原始数据处理为可用于后续分析的格式。第二步则是使用 mySORT 网络应用程序,它运用反卷积算法,能够计算出 21 种免疫细胞类型的相对比例,并通过多种可视化方式,如层次聚类、α 多样性和 β 多样性分析图,展示免疫细胞的多样性特征。

在研究过程中,研究人员构建了合成的伪批量基因表达数据,以此来验证 mySORT 的性能。他们从 NCBI GEO 数据库下载了黑色素瘤和头颈部癌患者的单细胞 RNA - seq 数据,经过严格的数据质量控制,筛选出高质量的细胞,构建伪批量基因表达谱。同时,计算出免疫细胞组成的真实值,与 mySORT 的预测值进行对比。结果令人欣喜,在黑色素瘤患者数据集中,mySORT 预测值与真实值的皮尔逊相关系数达到了 0.871;头颈部癌患者数据集中,该系数也有 0.775。这表明 mySORT 在预测免疫细胞组成方面具有较高的准确性。

此外,研究人员还利用非小细胞肺癌(NSCLC)患者的单细胞 RNA - seq 数据对 mySORT 进行了进一步验证。同样,经过数据筛选和处理,构建伪批量基因表达谱并计算免疫细胞比例。虽然整体相关系数略低于前两个数据集,但在 T 细胞、B 细胞、肥大细胞和嗜中性粒细胞这四种免疫细胞的预测上,mySORT 仍展现出良好的性能,相关系数在 0.632 - 0.902 之间。

在系统实现方面,mySORT 采用 Linux - Apach - MySQL - PHP(LAMP)系统架构,运行在虚拟机器上,为用户提供了一个操作简便的平台。用户只需上传包含基因表达矩阵的文本或 CSV 文件,mySORT 就能进行分析,并输出免疫细胞组成比例表、层次聚类图、多样性分析图等丰富的结果。

与现有的方法如 CIBERSORT 相比,mySORT 具有明显优势。它无需用户注册,操作更为便捷,而且在数据可视化方面更加直观和全面,不仅能展示免疫细胞组成的相对比例,还能通过多种分析方式深入挖掘数据信息。

研究结论表明,mySORT 为解析肿瘤免疫微环境提供了一种强大且可靠的工具。它能够帮助科研人员更深入地了解肿瘤微环境中免疫细胞的组成和多样性,为癌症免疫治疗的精准化发展提供有力支持。不过,研究也发现 mySORT 在预测某些细胞类型(如巨噬细胞)时,准确性还有提升空间。未来,研究人员计划整合更多高质量的单细胞或批量细胞数据集,优化模型训练,并探索基于深度神经网络的架构,以进一步提高 mySORT 的性能。

这项研究成果发表在《BMC Cancer》杂志上,为癌症免疫治疗领域带来了新的突破。它为后续的基础研究和临床实践提供了重要的参考,有望推动癌症免疫治疗向更加精准、高效的方向发展,让更多癌症患者从中受益。

主要技术方法


研究主要运用了 RNA 测序(RNA - seq)技术获取基因表达数据。从 NCBI GEO 数据库获取黑色素瘤(GSE72056)、头颈部癌(GSE103322)和非小细胞肺癌(GSE148071)患者的单细胞 RNA - seq 数据,经质量控制后构建伪批量基因表达数据。利用基于 hisat2 - stringtie 的 DOCexpress_fastqc 工具进行基因表达谱分析,再通过 mySORT 网络应用程序的反卷积算法计算免疫细胞比例。

研究结果


  1. 表达谱估计与合并:开发的 DOCexpress_fastqc 工具能整合 hisat2 - stringtie 流程和自定义脚本,在 Galaxy/Docker 环境下处理 RNA - seq 数据,将转录组按基因符号或转录本合并为 FPKM 或 TPM 格式,为后续分析提供数据支持。
  2. mySORT 网络应用的使用:用户上传经 DocExpress_fastqc 生成的基因表达矩阵文件,mySORT 可进行分析。其输出包括各样本免疫细胞组成比例表、基于免疫细胞组成的样本层次聚类图、样本间差异的 α 和 β 多样性可视化图,以及包含多种数据的下载区域。
  3. α 和 β 多样性可视化:采用辛普森 α 多样性指数和非度量多维缩放(NMDS)图分别衡量样本内和样本间免疫细胞组成的多样性。通过这些分析,可深入了解肿瘤免疫微环境的复杂性和异质性。
  4. mySORT 性能验证:利用黑色素瘤和头颈部癌患者的单细胞 RNA - seq 数据构建的伪批量数据,以及非小细胞肺癌患者的单细胞 RNA - seq 数据,验证了 mySORT 在预测免疫细胞组成方面的准确性。多数免疫细胞类型预测值与真实值相关性良好,整体性能优于现有方法。

研究结论与讨论


本研究开发的由 DOCexpress_fastqc 和 mySORT web 构成的两步工作流程,有效解决了从转录组数据解析免疫细胞组成的难题。mySORT 在免疫细胞组成预测上准确性较高,且具备强大的数据可视化功能,为研究肿瘤免疫微环境提供了有力工具。尽管在预测巨噬细胞等特定细胞类型时存在局限性,但未来通过整合更多高质量数据集和探索新的神经网络架构,有望进一步提升其性能,推动癌症免疫治疗的精准医学应用。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号