
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习算法的乳腺癌和肺癌患者颅内转移风险预测模型构建与验证研究
【字体: 大 中 小 】 时间:2025年09月01日 来源:Neuro-Oncology Advances 4.1
编辑推荐:
本研究针对乳腺癌和肺癌患者颅内转移(IMD)高风险人群早期识别难题,利用机器学习(ML)技术对安大略省143,341例患者数据进行分析,开发出具有优异判别效能的预测模型(PPV 0.82-0.95,AUPRC 0.75-0.85),通过SHAP分析揭示组织学类型、肿瘤部位等关键预测因子,为个性化风险分层和精准监测提供新工具。
当癌细胞突破血脑屏障在颅内安营扎寨时,颅内转移性疾病(Intracranial Metastatic Disease, IMD)便成为肿瘤患者最凶险的并发症之一。统计显示,约30%的实体瘤患者最终会发展为IMD,其中乳腺癌和肺癌患者尤为脆弱——前者3%会发生转移,后者比例高达11%。这种"脑部殖民"不仅导致患者生存期急剧缩短,更伴随着瘫痪、失语等毁灭性神经功能障碍。然而传统临床预测工具在识别高风险人群时往往力不从心,使得许多患者错失早期干预良机。
面对这一临床困境,来自多伦多的Marco V Istasy*和Sunit Das团队在《Neuro-Oncology Advances》发表创新研究。他们另辟蹊径,将机器学习(ML)这一人工智能利器引入IMD预测领域。研究团队收集了安大略省2010-2023年间143,341例乳腺癌和肺癌患者的全景医疗数据,构建起迄今为止最大规模的IMD研究队列。通过对比多种算法性能,最终开发出预测精度显著优于传统统计方法的ML模型。这些模型不仅能准确预测总体IMD风险,还可精准计算五年内的动态风险变化。
关键技术方法包括:1)基于安大略省人口健康数据库构建143,341例患者队列;2)采用多种机器学习算法开发预测模型;3)通过Shapley Additive exPlanations(SHAP)进行特征重要性分析;4)使用精确率-召回率曲线下面积(AUPRC)等指标评估模型性能。
【模型性能验证】章节显示,所有ML模型均展现出卓越的判别能力。在预测乳腺癌患者IMD风险时,阳性预测值(PPV)达到0.82-0.89;对肺癌患者的预测更为精准,PPV高达0.87-0.95。模型在时间维度上的预测稳定性同样令人瞩目,五年风险预测的AUPRC维持在0.75-0.85区间,远超临床常用评分系统。
【关键预测因子】部分揭示了有趣的肿瘤类型差异:对乳腺癌患者,组织学类型(histology)、肿瘤偏侧性(laterality)和年龄构成三大预测支柱;而在肺癌队列中,肿瘤原发部位(site)、组织学亚型与患者性别则成为最显著的预警信号。这种差异提示两种癌症的IMD发生可能存在截然不同的生物学机制。
【临床适用性】分析证实,该模型能有效识别出传统方法易漏诊的高风险人群。例如某些组织学亚型(如乳腺小叶癌)患者虽不符合常规高风险标准,但模型仍能通过多维度特征组合准确捕捉其IMD风险。
这项研究的突破性意义在于:首次证明ML算法可突破传统预测模型的性能瓶颈,为IMD高风险人群筛查提供可靠工具;通过SHAP分析揭示的预测因子差异,为后续机制研究指明方向;模型输出的个性化风险评分,使临床医生能有的放矢地安排影像监测频率,既避免过度检查又确保及时干预。随着精准医学时代来临,这种数据驱动的决策支持系统或将重塑癌症转移防控体系。
生物通微信公众号
知名企业招聘