基于可解释深度学习的非侵入性肿瘤监测与诊断新方法:Oncoder高效解析ctDNA甲基化图谱

【字体: 时间:2025年08月02日 来源:iScience 4.1

编辑推荐:

  本研究针对ctDNA在cfDNA中极低丰度检测的难题,开发了基于概率估计的可解释深度学习工具Oncoder。通过自主构建甲基化参考图谱,实现了肿瘤信号的精准解卷积,在模拟数据中预测误差降低30%,肝癌早期诊断AUC达0.95。该技术为肿瘤动态监测和早筛提供了经济高效的解决方案,相关成果发表于《iScience》。

  

在肿瘤诊疗领域,如何实现早期精准诊断始终是重大挑战。传统影像学检查存在灵敏度不足、成本高昂等问题,而组织活检的侵入性又限制了其应用。随着液体活检技术的发展,循环肿瘤DNA(ctDNA)检测为肿瘤早诊带来了新希望。然而,ctDNA在血液中的含量极低(通常<1%),且存在高度异质性,这使得从海量背景噪音中提取肿瘤信号如同"大海捞针"。

中山大学医学院(深圳校区)的研究团队在《iScience》发表了一项突破性研究,开发出名为Oncoder的深度学习工具。该工具通过创新性地整合概率估计与可解释人工智能技术,成功实现了从cfDNA甲基化数据中高效解析肿瘤信号,为肿瘤无创监测提供了新范式。

研究采用三大关键技术:1)基于TCGA和GEO数据库的甲基化特征筛选,通过ANOVA和Tukey-Kramer检验从450K甲基化芯片数据中筛选出10%最具区分度的HCC特征位点;2)构建混合Dirichlet分布的模拟训练集(5000例),结合负对数似然损失函数训练自动编码器;3)开发自适应学习算法,利用GSE129374等独立队列验证跨平台性能。

研究结果主要体现在四个方面:

Oncoder具有科学可泛化的甲基化图谱学习能力

通过10次重复训练验证,Oncoder学习的肿瘤甲基化图谱与实际样本的中位相关系数达0.79(正常血浆为0.96)。PCA分析显示学习图谱位于真实样本簇中心,欧氏距离(肿瘤6.4,正常8.09)显著小于组间距离,证实了图谱可靠性。

模拟数据验证优越的解卷积性能

与NNLS(非负最小二乘法)和SRFD(半参考自由解卷积)相比,Oncoder在PCC(皮尔逊相关系数)和RMSE(均方根误差)指标上均显著领先。特别在ctDNA含量<0.1%时,预测误差降低达30%,且不受正常血浆成分波动影响。

真实世界数据验证诊断效能

在66例HCC和79例正常对照队列中,Oncoder的AUC达0.95(灵敏度93.94%,特异性100%)。对22例肝硬化合并HCC患者的检测显示,其能区分单纯肝硬化与癌变(p=0.0004),AUC为0.81。

临床应用场景拓展

在治疗监测方面,Oncoder成功追踪了前列腺癌患者对阿比特胺的响应动态(p=0.0098),并识别出11例结直肠锯齿状病变高危患者(灵敏度100%,特异性83%)。在肝癌I期即实现73.86%的检出率,显著优于现有方法。

这项研究的创新性在于首次将概率估计融入深度学习框架,解决了传统方法面临的三大瓶颈:1)突破NNLS对预设参考图谱的依赖;2)通过β分布建模克服肿瘤异质性;3)利用解码器结构提供生物学解释。实测显示其处理1000例样本仅需0.0405秒,较SRFD提速800倍,为大规模筛查奠定基础。

值得关注的是,Oncoder仍存在改进空间:1)配对癌旁组织样本不足可能引入非特异性信号;2)当前基于芯片数据,未来整合WGBS(全基因组甲基化测序)有望提升性能。该工具已开源(GitHub: yyp1999/Oncoder),其设计思路为其他表观遗传标志物分析提供了普适性框架。

这项由广东省基础与应用基础研究基金(2022A1515220204)等资助的成果,标志着人工智能驱动的新型液体活检技术迈入可解释、可泛化的新阶段,为肿瘤早诊和动态监测提供了极具转化前景的工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号