编辑推荐:
为解决肿瘤微环境(TME)生物标志物难以发现及深度学习方法可解释性差的问题,研究人员开展了 “Bi-level Graph 学习揭示乳腺癌数字病理中预后相关的 TME 模式” 的研究。结果发现 TME 特征模式可用于患者风险分层,且该方法具可解释性。这为癌症预后评估和治疗提供了新途径。
在癌症研究的领域中,肿瘤微环境(Tumor Microenvironment,TME)一直是备受关注却又充满挑战的研究对象。TME 就像一个复杂的 “生态系统”,里面包含了增殖的肿瘤细胞、肿瘤基质、免疫细胞以及血管等多种成分 ,它在肿瘤的发展、治疗抵抗和患者预后方面都有着至关重要的作用。随着空间多重蛋白质组学技术的发展,如多重免疫组化(mIHC)、编码检测(CODEX)等,研究者们能够在单细胞水平对 TME 进行全面探索。但目前从病理学中发现的可用于预后评估的通用生物标志物数量有限,而且传统的基于假设驱动的研究方法,依赖于领域专家的先验知识,这在一定程度上限制了对 TME 与临床结果之间关联模式的探索。现代深度学习方法虽然在研究 TME 与疾病关系方面有一定成果,但存在可解释性差和泛化能力有限等问题。在这样的背景下,为了深入探究 TME 与患者预后之间的关系,挖掘出有价值的生物标志物,来自约翰霍普金斯大学(Johns Hopkins University)的研究人员开展了一项重要研究,相关成果发表在《Patterns》杂志上。
研究人员采用的主要关键技术方法如下:
- 构建细胞图(Cellular Graph):根据细胞的空间坐标和表型构建细胞图,每个节点代表一个细胞,细胞间的连接通过加权边表示,边的权重随细胞间距离增加而减小118。
- Soft-WL 子树内核(Soft-WL Subtree Kernel):这是一种对传统 WL 子树内核的改进方法,通过计算子树的特征嵌入、聚类相似子树来识别 TME 模式,并基于 TME 模式的丰度计算患者间的相似度219。
- 构建群体图(Population Graph)与社区检测:利用 Soft-WL 子树内核计算的相似度构建群体图,每个节点代表一个患者,再使用 Louvain 社区检测算法识别具有相似 TME 模式的患者亚组820。
- 数据集与验证:使用了 Danenberg 等人、Jackson 等人和 Wang 等人整理的乳腺癌患者队列数据,通过将外部验证集的细胞表型与发现集对齐,在内部验证集和外部验证集中验证研究结果414。
下面介绍具体的研究结果:
- BiGraph:捕获多尺度信息的互联细胞图和群体图:BiGraph 以单细胞数据为输入,通过构建细胞图和群体图,利用图内核方法挖掘不同尺度下的信息,最终实现对患者的风险分层,并识别出每个亚组的细胞模式3。
- 细胞图分析揭示异质性 TME 模式:在发现集中为每个患者构建细胞图,Soft-WL 子树内核生成子树并聚类,得到 66 个 TME 模式,这些模式可分为肿瘤龛、免疫龛、基质龛和界面龛四类,大多数患者的细胞图中都包含这四类模式,但相对丰度存在差异56。
- TME 模式的丰度提供患者间的相似性:Soft-WL 子树内核通过比较患者间 TME 模式的直方图余弦相似度,来量化患者间的相似性,结果显示不同患者的 TME 模式存在差异,该方法能够区分患者 TME 的细微差别7。
- 群体图分析提供数据驱动的风险分层:基于 Soft-WL 内核构建群体图并进行社区检测,识别出七个患者亚组(S1 - S7)。生存分析表明,这些亚组的生存结果存在显著差异,例如 S1 患者生存情况较差,S7 患者生存情况较好89。
- BiGraph 为标准临床特征提供补充信息:研究发现 BiGraph 衍生的亚组与临床亚型一般不相关,但在某些情况下,两者的交集可揭示独特的生存模式,这表明 BiGraph 能够为临床亚型提供补充信息,增强风险分层能力1011。
- BiGraph 揭示与预后相关的 TME 模式:通过比较患者亚组内外 TME 模式的直方图,识别出每个亚组的特征性 TME 模式。例如,S1 亚组的特征模式为 HER2+肿瘤龛,与较差的生存相关;S7 亚组的特征模式为 CKhighCXCL12high肿瘤龛,与较好的生存相关1213。
- 验证与泛化:在内部验证集和外部验证集中对风险分层和 TME 模式的预后价值进行验证。结果表明,在外部验证集中风险分层结果具有统计学意义,且 HER2+肿瘤龛和 CKhighCXCL12high肿瘤龛等模式在验证集中与发现集的结果趋势一致,同时在三阴乳腺癌(TNBC)患者中,TLS 样龛与较好的生存相关1415。
- 与替代方法的比较:研究人员比较了 BiGraph 与其他测量患者间相似性的替代方法,如细胞类型丰度、细胞表型的成对邻近度等。结果显示,BiGraph 在识别与预后相关的患者亚组和特征性 TME 模式方面优于其他方法1617。
在研究结论与讨论部分,该研究构建的 BiGraph 方法为乳腺癌患者的风险分层提供了新的视角,发现的特征性 TME 模式与患者的预后密切相关,且该方法具有可解释性,能够为临床治疗提供更有价值的信息。例如,HER2+肿瘤龛与更具侵袭性的临床特征相关,而 CKhighCXCL12high肿瘤龛则与较好的预后相关。此外,在 TNBC 患者中发现的 TLS 样龛也显示出潜在的预后和预测价值。不过,该研究也存在一定的局限性,如样本量较小,Soft-WL 子树内核存在过平滑现象等。未来的研究可以进一步扩大样本量,应用于更多疾病类型,并改进 Soft-WL 子树内核等方法,以推动癌症研究和临床治疗的发展。总之,这项研究为癌症预后评估和生物标志物发现提供了新的思路和方法,在癌症研究领域具有重要的意义。