编辑推荐:
【编辑推荐】为解决 BRAF 突变检测有创、滞后等问题,本研究基于 CT 静脉期影像,对 301 例结直肠癌(CRC)患者开展影像组学分析,构建 6 种机器学习模型。结果显示未扩展肿瘤的随机森林(RF)模型性能最佳,为 CRC 精准诊疗提供无创新策略。
结直肠癌(CRC)作为全球发病率第三、死亡率第二的恶性肿瘤,其分子特征的精准评估对治疗策略选择至关重要。BRAF 基因作为表皮生长因子受体(EGFR)下游丝裂原活化蛋白激酶(MAPK)通路的关键组分,其 V600E 突变会导致通路持续激活,促进肿瘤增殖并引发 EGFR 抑制剂耐药。当前临床依赖有创活检和聚合酶链反应(PCR)检测 BRAF 突变,存在操作延迟、样本异质性等局限,亟需无创替代方案。
在此背景下,青海大学附属医院与兰州大学第二医院的研究团队开展了一项基于 CT 影像组学的 BRAF 突变预测研究。该研究成果发表于《Abdominal Radiology》,为结直肠癌分子分型提供了全新的影像视角。
研究纳入 301 例经病理确诊的结直肠癌患者,其中 225 例来自中心 I(73 例突变型、152 例野生型),76 例来自中心 II(36 例突变型、40 例野生型)。中心 I 队列按 7:3 比例分为训练集(158 例)和内部验证集(67 例),中心 II 作为独立外部验证集。研究采用 ITK-SNAP 软件对 CT 静脉期影像进行肿瘤全区域手动分割,并通过 Python 代码将肿瘤轮廓向外扩展 3 mm,分别提取未扩展(Pro)和扩展(Post)区域的影像组学特征。
关键技术方法包括:①影像预处理:使用 PyRadiomics 软件对 CT 图像进行体素重采样(1 mm×1 mm×1 mm)和灰度离散化(bin width=25);②特征筛选:通过 t 检验、Pearson 相关性分析和 LASSO 回归筛选与 BRAF 突变强相关的特征;③模型构建:基于支持向量机(SVM)、决策树(DT)、随机森林(RF)等 6 种机器学习算法,分别构建 Pro 和 Post 模型;④性能评估:采用受试者工作特征曲线(ROC)、决策曲线分析(DCA)、准确率、灵敏度和特异度等指标评估模型效能。
临床特征与影像组学特征分析
单因素分析显示,BRAF 突变型与野生型患者的性别分布存在显著差异(P<0.05),女性突变率更高。通过影像组学分析,从 2264 个初始特征中筛选出 11 个 Pro 特征和 17 个 Post 特征,分别构建 12 个预测模型。
模型性能比较
在训练集、内部验证集和外部验证集中,未扩展肿瘤的 RF 模型(Pro RF)表现最佳:
- 训练集:AUC 为 0.814(95% CI 0.732–0.895),准确率 0.810,灵敏度 0.620,特异度 0.898;
- 内部验证集:AUC 为 0.798(95% CI 0.690–0.907),准确率 0.761,灵敏度 0.609,特异度 0.841;
- 外部验证集:AUC 为 0.737(95% CI 0.616–0.847),准确率 0.658,灵敏度 0.667,特异度 0.650。
扩展肿瘤模型(Post)整体性能低于 Pro 模型,提示 BRAF 突变主要影响肿瘤内部异质性,而非周围浸润模式。
模型临床价值与机制探讨
决策曲线分析(DCA)显示,Pro RF 模型在不同阈值概率下均具有较高的净临床获益,尤其在低阈值时表现优异。SHAP 值分析表明,log_firstorder_log.sigma.0.5.mm.D.Maximum(最大灰度值)是最重要的预测特征,其升高可能与 BRAF V600E 突变诱导的细胞密度增加和代谢活性增强相关,印证了 MAPK 通路激活的病理机制。
研究进一步发现,性别可作为独立预测因子,联合影像组学特征构建的模型(RF + 临床特征)在训练集、内部验证集和外部验证集的 AUC 分别提升至 0.886、0.882 和 0.873,显示出整合多维度数据的潜力。
结论与意义
本研究证实,基于 CT 静脉期影像的放射组学模型可有效预测结直肠癌 BRAF 突变状态,其中随机森林算法在未扩展肿瘤区域表现最优。该模型为临床提供了一种无创、便捷的分子分型工具,有望减少不必要的有创活检,优化治疗决策(如指导 EGFR 抑制剂与贝伐珠单抗的选择)。尽管存在回顾性设计、样本量有限等局限,但其为影像组学在精准肿瘤学中的应用奠定了基础,未来需通过多中心前瞻性研究进一步验证。