UnCOT-AD:基于非配对跨组学翻译的阿尔茨海默病多组学整合预测新方法

【字体: 时间:2025年08月28日 来源:Briefings in Bioinformatics 7.7

编辑推荐:

  本研究针对阿尔茨海默病(AD)预测中多组学数据配对稀缺的难题,开发了首个非配对跨组学翻译框架UnCOT-AD。通过耦合变分自编码器(VAE)和新型循环一致性机制,实现了基因表达与DNA甲基化等组学数据的双向精准转换,结合对抗训练和对比学习捕获疾病特异性模式。实验表明该方法在AD预测准确率(94.98%)和跨组学翻译性能(CCL 0.0476)上均达到领先水平,为复杂疾病的多组学研究提供了创新工具。

  

随着全球老龄化加剧,阿尔茨海默病(AD)已成为严峻的公共卫生挑战。这种神经退行性疾病以认知功能进行性恶化为特征,目前尚无根治方法。传统诊断主要依赖临床症状和单一组学数据,难以捕捉疾病复杂的分子机制。虽然高通量测序技术的发展带来了转录组、表观基因组等多组学数据,但一个关键瓶颈在于:不同组学数据往往来自不同样本群体,这种"非配对"特性导致现有方法不得不使用生物学意义存疑的人工配对数据,严重影响预测准确性。

针对这一挑战,Abrar Rahman Abir等研究者在《Briefings in Bioinformatics》发表的研究中,提出了名为UnCOT-AD的创新框架。该研究首次实现了非配对跨组学翻译,通过深度学习技术突破数据配对的限制,为AD的多组学研究开辟了新途径。

研究采用三个关键技术模块:1)基于耦合变分自编码器(VAE)的跨组学翻译模块,利用来自ROSMAP和ADNI队列的696例RNA-seq、142例DNA甲基化和89例蛋白质组学数据;2)结合循环一致性损失(CCL)和对抗训练的优化策略;3)动态权重融合的多组学预测模块。通过TCGA BRCA队列验证跨组学翻译性能。

研究结果部分,"UnCOT-AD improves AD prediction by integrating multi-omics data over single omics"表明,整合基因表达与预测DNA甲基化数据时,模型准确率高达94.98%,较单组学基线提升7.63%。F1分数和MCC分别达到0.9594和0.8950,证实多组学整合的优越性。

"AD prediction performance comparison with baseline models"章节显示,UnCOT-AD在基因-DNA甲基化组合上以94.98%准确率显著优于Abbas等(86.89%)、Mahendran等(84.02%)和Park等(86.11%)的基线模型。将基线模型改用本研究生成的配对数据后,性能平均提升5.2%,印证了跨组学翻译的有效性。

"Cross-omics translation performance"部分创新性地提出Fréchet Omics Distance(FOD)评估指标。在基因→蛋白质翻译任务中,UnCOT-AD的FOD为0.5404,远低于CycleGAN(1.2543)和自编码器基线(2.2015)。在配对数据测试中,其基因-蛋白质互译的Pearson相关系数(0.33/0.52)超越BABEL和Polarbear等专用模型。

"UnCOT-AD preserves biologically relevant AD markers in translated omics profiles"通过生物标志物分析发现,翻译后的组学数据成功保留了APP、GFAP等关键AD相关基因的表达特征,DNA甲基化模式也准确反映了HOXA等基因簇的表观遗传变化,证实生成数据的生物学合理性。

该研究的突破性在于:首次实现非配对数据的跨组学翻译,解决了多组学整合的核心瓶颈;提出的循环一致性和对抗训练策略保障了生成数据的生物学可信度;动态权重融合机制有效捕捉了不同组学的互补信息。这些创新不仅将AD预测准确率提升至新高度,其方法论更可推广至其他复杂疾病研究。未来通过纳入代谢组等更多组学维度,有望进一步揭示AD的分子网络机制。研究开源的代码框架(https:/github.com/abrarrahmanabir/UnCOT-AD)为领域发展提供了重要工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号