基于可解释人工智能的口腔鳞癌预后生物标志物挖掘及其分子机制研究

【字体: 时间:2025年07月18日 来源:Cancer Genetics 1.4

编辑推荐:

  本研究针对口腔鳞癌(OSCC)高复发率导致的预后差难题,创新性应用可解释人工智能(XAI)技术分析GSE31056数据集,鉴定出FAM49B、IFI16等20个关键预后基因及hsa-let-7b-5p等调控miRNA,为OSCC精准诊疗提供新靶点。

  

口腔癌是全球最致命的恶性肿瘤之一,其中口腔鳞状细胞癌(OSCC)占据头颈癌病例的90%。令人担忧的是,即使经过手术和放化疗等综合治疗,近半数患者仍会在术后1年内复发,五年生存率长期停滞在50%左右。这种严峻现状主要归因于两个"黑箱":一是缺乏能准确预测复发的分子标志物,二是现有机器学习模型的可解释性不足。在印度等亚洲国家,由于烟草咀嚼等生活习惯,OSCC发病率更是高达全球三分之一。当肿瘤卷土重来时,医生往往陷入被动——既无法预判哪些患者会复发,也不清楚驱动复发的关键分子机制。

为破解这些难题,研究人员开展了一项融合生物信息学与可解释人工智能(XAI)的创新研究。他们从NCBI GEO数据库筛选出包含38例复发和58例未复发OSCC样本的GSE31056数据集,采用极端梯度提升(XGBoost)算法构建预测模型,并引入博弈论衍生的SHAP值解释框架。通过这种"算法显微镜",不仅实现了复发预测,更关键的是揭示了隐藏在数据背后的分子对话规律。

研究主要采用三大技术路径:首先对微阵列数据进行log2转换和分位数标准化预处理;随后应用XGBoost机器学习筛选特征基因,并计算SHapley Additive exPlanations(SHAP)值量化基因贡献度;最后通过miRTarBase数据库构建miRNA-mRNA调控网络。这种多组学整合策略既保证了计算精度,又确保了生物学可解释性。

【数据检索与预处理】

分析团队从96例OSCC样本中提取9983个基因表达特征,经严格质控后保留最具区分度的特征基因。这种基于表达谱的"分子指纹"采集为后续智能分析奠定了数据基础。

【结果】

XAI模型成功锁定20个核心预后基因,其中FAM49B和TTC39A在复发组显著高表达,而GRIA2等基因则呈现保护性低表达。这些基因涉及细胞凋亡、侵袭转移等关键通路。更引人注目的是发现hsa-let-7b-5p、hsa-miR-27a-3p等miRNA如同"分子总开关",可同时调控多个预后基因,其中hsa-miR-124-3p与ANGPTL4等基因的互作网络尤为密集。

【讨论】

该研究突破传统生物标志物研究的局限性:一方面,XAI技术克服了常规机器学习"黑箱"缺陷,使每个预测结果都具备可追溯的分子依据;另一方面,发现的IFI16等基因与已知癌症通路高度吻合,如IFI16通过干扰素信号调控肿瘤免疫微环境。特别值得注意的是,HSPH1作为热休克蛋白家族成员,其过表达可能帮助肿瘤细胞抵抗治疗压力,这为开发靶向药物提供了新思路。

【结论】

这项发表于《Cancer Genetics》的研究构建了OSCC首个XAI驱动的预后预测体系,不仅鉴定出FAM49B-ANGPTL4等新型分子标记组合,更揭示了miRNA介导的表观调控网络。这些发现如同为OSCC诊疗安装了"分子导航仪":临床医生可据此预判复发风险,科研人员则获得一批值得深入验证的 therapeutic targets(治疗靶点)。该成果为推进精准医疗提供了双重保障——既提升预测准确性,又确保决策透明度,展现出转化医学的广阔前景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号