
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于MALDI-TOF MS血清肽指纹图谱联合机器学习算法实现肝胆胰癌症的高精度无创诊断与分类
【字体: 大 中 小 】 时间:2025年08月10日 来源:Scientific Reports 3.9
编辑推荐:
本研究针对肝胆胰(HPB)癌症早期诊断难题,通过MALDI-TOF MS技术结合支持向量机(SVM)和随机森林(RF)算法,成功筛选出71个特征性血清肽质量指纹(PMFs),构建的诊断模型在训练集和测试集中准确率均超90%,AUROC达0.999。该研究为HPB癌症的精准分型提供了新型无创检测方案,具有重要临床转化价值。
肝胆胰(Hepato-pancreato-biliary, HPB)癌症包括胆管癌(CCA)、肝细胞癌(HCC)、胆囊癌(GBC)和胰腺导管腺癌(PDAC),因其侵袭性强、早期症状隐匿,确诊时多已进展至晚期。尽管影像学检查如CT和MRI是当前主要诊断手段,但其对早期病变鉴别能力有限,且依赖专业医师解读。传统肿瘤标志物CA19-9和AFP虽广泛应用,却存在敏感性和特异性不足的缺陷。更棘手的是,这类癌症常发生于解剖结构复杂区域,组织活检难度大且具有创伤性。这些诊断困境直接导致HPB癌症患者五年生存率不足20%,亟需开发高精度、无创的新型检测技术。
针对这一临床痛点,泰国孔敬大学医学院的研究团队创新性地将基质辅助激光解吸电离飞行时间质谱(MALDI-TOF MS)与机器学习算法相结合,对297例受试者(含健康对照50例、CCA 138例、GBC 16例、HCC 65例、PDAC 28例)的血清样本进行肽质量指纹(PMFs)分析。研究通过10倍交叉验证筛选出71个关键肽段特征,构建的支持向量机(SVM)模型在测试集中区分健康与癌症的准确率达98.55%,Matthews相关系数(MCC)为0.97,相关成果发表于《Scientific Reports》。
关键技术方面,研究采用四重技术重复的MALDI-TOF MS检测(质量范围1000-4000 Da),通过PLS-DA(偏最小二乘判别分析)和ANOVA筛选VIP≥1且p<0.05的肽段特征。建模阶段采用径向基核函数的SVM和500棵决策树的随机森林(RF),通过MetaboAnalyst 6.0平台完成性能评估。所有样本均来自孔敬大学附属医院的生物样本库,严格遵循伦理审查(批准号HE551404/HE661318)。
研究结果
术前实验室检查和肿瘤标志物水平
肝功能参数(ALT、AST、ALP、胆红素)和肿瘤标志物(CEA、CA19-9)在HPB癌症组显著高于健康对照组,但各癌种间无统计学差异。PDAC患者表现出最显著的肝功能异常,ALT中位数达72 U/L(健康组18 U/L),总胆红素4.0 mg/dL(健康组0.5 mg/dL)。
HPB癌症诊断的肽质量指纹
MALDI-TOF MS检测到1100个血清肽特征,热图分析显示健康组与癌症组的PMFs表达谱存在显著差异。

HPB癌症分类的关键肽质量指纹筛选
通过PLS-DA和ANOVA筛选的71个肽段在PCA分析中可解释84.9%的方差。值得注意的是,CCA与HCC组呈现部分分离,而健康组、GBC和PDAC组存在聚类重叠。RF模型的袋外误差率(OOB)仅2.2%,验证了特征稳定性。
SVM和RF模型的分类性能
SVM模型在测试集中展现卓越性能:健康vs所有癌症的AUROC达0.999,MCC 0.97;亚型分类中HCC鉴别效能最优(准确率99.68%,MCC 0.99)。RF模型同样表现优异,但SVM在处理类别不平衡时更具优势。两种算法共同识别的15个关键肽段(如m/z 1466.91、1898.01)具有跨模型一致性。
讨论与结论
该研究首次系统证实血清PMFs对HPB癌症的诊断价值,其性能显著优于传统标志物(CA19-9/AFP)。机器学习算法的引入解决了质谱数据高维、非线性难题,使模型在样本量不平衡情况下仍保持稳健性。特别值得关注的是,该技术对流行病学特征特殊的泰国东北部地区(肝吸虫高发区)的CCA表现出100%识别率,为地方性癌症筛查提供了新思路。
局限性在于部分亚型(如GBC)样本量偏少,且需在非流行区人群中验证普适性。未来研究应结合LC-MS/MS鉴定关键肽段的蛋白来源,并探索其与肿瘤微环境的关联。这项技术的临床转化将有望改变HPB癌症依赖影像学和活检的传统诊断模式,实现"一滴血"精准分型的突破。
生物通微信公众号
知名企业招聘