基于全切片基础模型与梯度提升的皮肤病理学BRAF突变状态预测新方法

【字体: 时间:2025年06月09日 来源:Computational and Structural Biotechnology Journal 4.5

编辑推荐:

  推荐:本研究针对黑色素瘤BRAF-V600突变状态预测难题,创新性地结合Prov-GigaPath全切片基础模型与XGBoost算法,开发了仅需组织病理学图像的弱监督预测框架。在TCGA数据集交叉验证中达到AUC 0.824,独立测试集(UHE)AUC 0.772,创图像单模态预测新纪录,为精准医疗提供了高效、可复现的AI决策支持工具。

  

在精准医疗时代,黑色素瘤的BRAF-V600突变检测直接决定着患者能否接受靶向BRAF/MEK抑制剂治疗。然而,传统基因检测存在耗时、成本高且依赖专业设备的瓶颈,而组织病理学作为常规诊断手段,其形态学特征与基因突变的关系尚未充分挖掘。德国杜伊斯堡-埃森大学WisPerMed研究培训组的研究团队在《Computational and Structural Biotechnology Journal》发表的研究,开创性地将全切片基础模型与经典机器学习结合,实现了仅凭H&E染色切片预测BRAF状态的技术突破。

研究团队采用"双阶段"技术路线:首先利用Prov-GigaPath模型(包含DINOv2预训练的tile encoder和LongNet架构的slide encoder)提取全切片特征,随后通过XGBoost分类器进行预测。实验采用TCGA-SKCM的275张切片进行训练,并在德国埃森大学医院(UHE)的68张独立切片上验证。关键技术包括:1) 基于高斯滤波(σ=10)和阈值(0.8)的自动化组织分割;2) Macenko染色归一化;3) 采用Optuna进行1000次超参数搜索优化XGBoost;4) 对比测试CONCH/TITAN、Virchow/PRISM、CTransPath/CHIEF等四种基础模型组合。

研究结果部分显示:

  1. 模型性能:单独使用Prov-GigaPath在TCGA交叉验证中取得AUC 0.653±0.039,而结合XGBoost后显著提升至0.824±0.043。在UHE测试集上,XGBoost方案达到0.772 AUC,比Schneider等先前研究提升18.4个百分点。
  2. 跨模型比较:作为特征提取器时,Prov-GigaPath+XGBoost组合以0.792 AUC显著优于其他模型,证实其slide encoder生成的768维特征最具判别力。
  3. 数据效率:仅需Vorontsov研究30%的数据量即达到相近性能,且全程无需人工标注。

讨论部分指出,该方法首次系统证实了组织形态学与BRAF突变的强关联性,其创新性体现在:1) 建立首个公开可复现的弱监督图像单模态预测流程;2) 揭示基础模型与传统ML协同增效的机制;3) 为资源匮乏地区提供分子检测替代方案。虽然当前0.77-0.82的AUC尚未达到临床替代标准,但相比传统病理诊断效率提升显著。研究团队特别强调,通过开源代码和标准化流程设计,该方法可快速适配其他生物标志物预测任务。

这项研究为数字病理学树立了新范式——通过Prov-GigaPath捕捉从细胞核异型性到肿瘤微环境的多尺度特征,再经XGBoost解码这些特征与BRAF信号通路的隐秘关联。未来整合多组学数据和更大规模前瞻性验证,或将推动AI辅助诊断从实验室走向临床决策系统。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号