
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习DNA甲基化模式分析的高级别浆液性卵巢癌早期诊断模型研究
【字体: 大 中 小 】 时间:2025年07月02日 来源:Scientific Reports 3.8
编辑推荐:
为解决上皮性卵巢癌(EOC)早期诊断难题,美国爱荷华大学团队通过人工智能(AI)技术分析手术标本DNA甲基化数据,构建了仅需9个甲基化探针即可100%准确预测高级别浆液性癌(HGSC)的模型,经独立数据集验证AUC达84%。该研究为液体活检技术开发提供了重要靶点,有望突破传统CA125和影像学诊断的局限性。
研究背景
卵巢癌被称为"沉默的杀手",其中高级别浆液性癌(HGSC)占上皮性卵巢癌(EOC)的70%,但超过75%患者确诊时已属晚期。尽管治疗手段不断进步,患者5年生存率仍不足30%。目前临床依赖的CA125检测和影像学方法,在早期诊断中敏感性和特异性均不理想。近年来,基于血液中循环游离DNA(cfDNA)的"液体活检"技术为癌症早筛带来曙光,其中DNA甲基化作为稳定的表观遗传标记,已在结直肠癌筛查中展现价值。
研究概况
美国爱荷华大学医院Jesus Gonzalez Bosquet团队在《Scientific Reports》发表研究,首次将深度学习与甲基化芯片技术结合,从850,000+个甲基化位点中筛选出9个关键生物标志物,构建了HGSC诊断模型。该模型在训练集中达到100%准确率(AUC=1.0),并在澳大利亚独立数据集验证中保持84%的判别效能。
关键技术方法
研究采用病例对照设计,纳入99例HGSC手术标本和12例正常输卵管对照。使用Illumina MethylationEPIC芯片检测全基因组甲基化谱,通过三步降维策略:1) MethylNet深度学习初筛23,397个特征;2) ANOVA方差分析筛选11,167个显著差异位点(p<0.05);3) LASSO回归最终确定9个核心探针。验证阶段采用TensorFlow机器学习平台和传统统计方法(pROC包)双重验证。
研究结果
DNA甲基化模型构建
初始MethylNet模型虽达100%准确度,但含23,397个特征难以临床应用。通过逐步优化:

模型验证
• 外部验证集(GSE65820)中:
讨论与意义
该研究首次证明极简甲基化标志物组合对HGSC的诊断价值。9个探针的筛选策略兼具创新性和严谨性:先通过深度学习处理高维数据,再经传统统计方法优化可解释性。值得注意的是,这些标志物在早期(I-II期)和晚期(III-IV期)患者中均表现稳定,提示其可能适用于癌症早期筛查。
局限性在于样本均来自西方人群(美国+澳大利亚),且对照组为手术切除的正常输卵管组织。未来需在更多种族人群和血液cfDNA中验证。研究者特别强调,下一步将重点优化该模型对盆腔良性肿物的鉴别能力,这是卵巢癌筛查面临的主要挑战之一。
这项研究为开发无创性卵巢癌早诊试剂盒奠定了分子基础,其"深度学习初筛+传统统计优化"的方法学框架,也为其他癌症的甲基化标志物研究提供了新范式。随着液体活检技术的成熟,这种仅需检测9个甲基化位点的极简模型,有望成为临床实用的卵巢癌筛查工具。
生物通微信公众号
知名企业招聘