基于五种肿瘤相关自身抗体与朴素贝叶斯模型的早期口腔鳞状细胞癌检测新策略

《Scientific Reports》:Early detection of oral squamous cell carcinoma using five tumor-associated autoantibodies and a Naive Bayes-based machine learning model

【字体: 时间:2026年04月16日 来源:Scientific Reports 3.9

编辑推荐:

  为探寻口腔鳞状细胞癌(OSCC)的早期、无创检测方案,研究人员聚焦于肿瘤相关自身抗体(TAAbs),通过生物信息学方法筛选候选基因,并运用酶联免疫吸附测定(ELISA)在496人队列中进行验证,最终鉴定出五种具有诊断潜力的TAAbs,并构建了诊断性能优异的朴素贝叶斯(NB)机器学习模型,为OSCC的早期筛查提供了新思路。

  
口腔,是人体健康的第一道门户,但其内部发生的癌症——口腔鳞状细胞癌(Oral Squamous Cell Carcinoma, OSCC),却常常因早期症状不明显而被患者和医生忽略。待到疼痛、溃疡或肿块等明显信号出现时,疾病往往已进展至中晚期,治疗选择有限,患者预后较差。因此,如何“先发制人”,在癌症早期、甚至是亚临床阶段就将其识别出来,一直是临床医生和科研人员孜孜以求的目标。传统的诊断方法依赖于医生的视诊、触诊以及后续有创的组织病理活检,这对于大规模筛查和早期发现来说,既不便捷,也难以为大众所接受。近年来,液体活检,特别是从血液中寻找癌症的“蛛丝马迹”,因其无创、便捷的特性,成为研究的热点。其中,肿瘤相关自身抗体(Tumor-associated autoantibodies, TAAbs)作为一种内源性的生物标志物,因其在癌症早期就可能被免疫系统大量产生,且相对稳定,展现出了巨大的潜力。但挑战在于,如何在浩如烟海的蛋白质中,精准地找到那些能高效区分OSCC患者与健康人的TAAbs,并构建出可靠的诊断工具?
为了解决这一难题,一篇发表在《Scientific Reports》上的研究给出了他们的探索路径。研究人员巧妙地结合了生物信息学筛选、高通量血清检测与先进的机器学习算法,旨在建立一套基于TAAbs的OSCC早期检测模型。首先,他们利用生物信息学分析,从公共数据库中筛选出12个与OSCC密切相关的候选基因。接着,他们选择了由这些基因编码的蛋白质作为候选的肿瘤相关抗原(Tumor-associated antigens, TAAs),并检测了血液中针对这些抗原的自身抗体水平。研究纳入了496名参与者的血清样本,通过酶联免疫吸附测定(Enzyme-Linked Immunosorbent Assay, ELISA)技术,对这12种候选TAAbs进行了量化分析。在数据分析阶段,研究团队构建了八种不同的机器学习诊断模型,并利用SHAP可解释性技术来解读最佳模型的决策依据。最终,他们成功鉴定出五种具有诊断潜力的TAAbs,并发现基于这五种抗体构建的朴素贝叶斯模型性能最优。这项研究不仅为OSCC的早期无创诊断提供了新的候选生物标志物组合,也展示了机器学习在医学诊断领域的强大应用前景。
关键研究方法概览
本研究采用生物信息学方法从公共数据库筛选出12个OSCC相关候选基因。以这些基因编码的蛋白质为候选肿瘤相关抗原(TAAs),利用酶联免疫吸附测定(ELISA)技术,对来自496名参与者(包含OSCC患者与健康对照)的血清样本中相应的12种肿瘤相关自身抗体(TAAbs)水平进行检测。随后,研究运用了八种机器学习算法构建诊断模型,并通过受试者工作特征曲线下面积(AUC)等指标评估模型性能,最后利用SHAP方法对最优模型进行可解释性分析。
研究结果
  • 生物信息学筛选与候选抗体鉴定
    通过生物信息学分析,研究共确定了12个候选基因。其中,有8个基因编码的蛋白被确认在OSCC组织中存在过表达。基于mRNA表达证据,这12种编码蛋白全部被纳入作为候选的肿瘤相关抗原(TAAs)。
  • 具有诊断潜力的五种TAAbs
    在检测对应的自身抗体后,研究发现有五种TAAbs(抗-BLM、抗-BUB1、抗-KIF18A、抗-KIF2C和抗-TPX2)在训练集和验证集中均显示出潜在的诊断性能。
  • 机器学习模型构建与评估
    研究共构建了八种机器学习模型。其中,朴素贝叶斯(Naive Bayes, NB)模型表现最佳,在训练集中的AUC为0.75 (95%置信区间0.70–0.80),在验证集中的AUC为0.66 (95%置信区间0.57–0.75)。
  • 模型可解释性分析
    研究应用SHAP可解释性方法对最优的NB模型进行分析。结果显示,在这五种TAAbs中,抗-KIF2C抗体对模型预测性能的贡献最大。
研究结论与意义
本项研究成功识别出五种对口腔鳞状细胞癌具有潜在诊断价值的肿瘤相关自身抗体(TAAbs),包括抗-BLM、抗-BUB1、抗-KIF18A、抗-KIF2C和抗-TPX2。基于这五种TAAbs构建的朴素贝叶斯机器学习模型,展现出了良好的诊断性能。SHAP分析进一步揭示了抗-KIF2C是模型中最重要的预测因子。这项工作的意义在于,它首次将这一组特定的TAAbs组合与机器学习模型相结合,用于OSCC的早期检测探索。所建立的血清学检测方案具有无创、便捷的优点,为开发OSCC的早期筛查工具提供了新的候选生物标志物和可行的技术路径。虽然模型在独立验证集中的性能有待进一步提升,但这项研究为未来更大规模、多中心的验证研究奠定了基础,并彰显了多组学数据整合与人工智能在转化医学和精准医疗中的应用潜力。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号