编辑推荐:
乳腺癌生存预测因基因与细胞复杂互作而困难。研究人员开展基因表达谱(GEP)结合基于代理建模(ABM)的研究,通过 GEP 筛选关键基因,ABM 模拟肿瘤生长及治疗反应。结果显示模型预测准确性高,为个性化治疗提供新方向。
乳腺癌如同隐匿在女性健康领域的 “杀手”,其复杂的生物学特性使得生存预测和个性化治疗面临巨大挑战。传统预测方法依赖肿瘤大小、激素受体状态等指标,却难以捕捉基因与细胞间动态互作的奥秘。在这样的背景下,为了突破现有预测模型的局限性,精准解析肿瘤行为并实现个体化治疗,印度韦洛尔理工学院(Vellore Institute of Technology)的研究人员开展了一项极具创新性的研究,相关成果发表在《Scientific Reports》。
研究人员采用基因表达谱(GEP)与基于代理建模(ABM)相结合的方法。GEP 通过检测 mRNA 水平分析数百个基因的活性,筛选出与乳腺癌亚型、进展及治疗反应相关的基因特征;ABM 则模拟肿瘤微环境中单个细胞的行为及相互作用,结合数学模型刻画肿瘤生长、侵袭和治疗响应过程。研究借助 TCGA-BRCA、GSE96058 等多个临床数据集,通过 C-Index、AUC-ROC 等指标验证模型性能。
关键技术方法
研究主要运用以下技术:① 基因表达谱分析:通过微阵列和 RNA 测序(RNA-seq)获取基因表达数据,结合差异表达分析(DEA)和机器学习(ML)筛选关键基因;② 基于代理建模:构建包含乳腺癌细胞、免疫细胞等代理的模型,定义代理属性(如基因表达水平、细胞大小)和交互规则,通过敏感性分析和参数估计校准模型;③ 生存分析与验证:利用 C-Index、AUC-ROC 等指标评估模型预测能力,在 METABRIC、TCGA-BRCA 等多个队列中进行交叉验证。
研究结果
基因表达谱解析肿瘤分子特征
通过微阵列和 RNA 测序分析肿瘤样本的基因表达动态,建立分子浓度变化的数学模型,如微阵列中分子结合与解离的动力学方程dtdB(t)=?kh?B(t)?[T]+kd?(Bmax?B(t)),以及 RNA 测序中反应物与产物浓度变化的方程dtdR(t)=?kdr?R(t)、dtdM(t)=kdr?R(t)?kdm?M(t),识别出与预后相关的差异表达基因。
基于代理建模模拟肿瘤动态
构建的 ABM 中,乳腺癌细胞代理具有位置、大小、基因表达谱(E={E1,E2,…,En})等属性,其大小变化dtdN=r?N(t)?(1?KN(t))和基因表达动态dtdEi=gi(S,Signals)?hi?k?A受微环境和细胞间交互影响。模型通过模拟肿瘤生长、免疫细胞作用及治疗响应,预测复发时间(Trelapse)和总生存期(OS)。
模型性能验证与关键特征识别
在不同数据集验证中,模型展现出良好性能:METABRIC 队列 C-Index 为 0.83(95% CI:0.80–0.86),AUC-ROC 达 0.84;TCGA-BRCA 和 GSE96058 队列 C-Index 分别为 0.82 和 0.80。关键预测特征包括突变计数、淋巴结转移状态、肿瘤大小等,其中 ESR1 和 TP53 基因表达与生存显著相关。
研究结论与意义
这项研究通过 GEP 与 ABM 的整合,构建了一个能够捕捉基因 - 细胞动态互作的乳腺癌生存预测模型。模型不仅在多个独立队列中验证了其预测准确性,还识别出驱动肿瘤进展的关键基因和通路,为理解乳腺癌生物学机制提供了新视角。更重要的是,ABM 的模拟能力使得 “虚拟测试” 不同治疗方案成为可能,为开发个性化治疗策略(如靶向 ESR1、TP53 相关通路)奠定了基础,有望推动乳腺癌精准医学的发展,让更多患者受益于个体化诊疗方案的制定。研究中建立的数学框架和分析方法,也为其他复杂癌症的预后预测和治疗研究提供了可借鉴的思路和方法。