多模态变分自编码器MyeVAE:提升新诊断多发性骨髓瘤风险分层的精准医学新策略

【字体: 时间:2025年08月29日 来源:BMC Artificial Intelligence

编辑推荐:

  本研究针对多发性骨髓瘤(MM)预后异质性难题,开发了基于深度学习的多模态变分自编码器MyeVAE,整合RNA-Seq基因表达、拷贝数变异、突变特征等6种组学数据与临床参数,实现了0.7的生存预测C-index。研究证实基因表达是最具预测价值的组学模态,并通过SHAP分析发现26S蛋白酶体亚基PSMD4等新型风险标志物,为MM精准分层治疗提供了数据驱动的AI解决方案。

  

多发性骨髓瘤(MM)被称为"千面癌症",其临床结局差异极大——部分患者可实现十年以上长期缓解,而约20%的高危患者却在数月内复发。这种异质性使得传统基于血清标志物和有限细胞遗传学特征的R-ISS分期系统显得力不从心。随着二代测序技术发展,APOBEC突变特征、1q21扩增等分子事件被证实与预后显著相关,但如何系统整合这些分散的组学数据成为精准医学的关键瓶颈。

《BMC Artificial Intelligence》最新发表的MyeVAE研究开创性地将深度学习引入MM风险预测领域。研究团队开发的多模态变分自编码器(VAE)架构,通过128维潜空间同步整合RNA-Seq基因表达、拷贝数状态、GISTIC峰值、FISH探针、SBS突变特征和IgH易位等6种组学数据,并结合年龄、性别、ISS分期等临床参数。模型采用半监督学习策略,将变分自编码器的KL散度正则化与Cox部分似然损失函数相结合,使潜空间既保留数据特征又与生存风险相关。技术关键包括:1)基于MMRF-CoMMpass队列(n=1143)的跨组学数据整合;2)SHAP算法解析特征贡献度;3)在UAMS-GSE24080等4个微阵列队列中进行外部验证。

研究结果部分呈现以下重要发现:

MyeVAE架构设计

模型通过共享潜空间同步处理多组学输入,生存网络将128维嵌入向量与临床特征结合输出-1至1的风险评分。如图1所示,这种设计使模型能捕捉APOBEC突变特征(SBS2/13)与1q21扩增等已知风险事件的非线性交互作用。

基因表达的主导作用

在六种组学模态中,RNA-Seq基因表达展现出最强预测价值。MyeVAE仅使用临床和基因表达数据即在内部验证达到OS的C-index 0.702,显著优于传统GEP标志物UAMS70(0.659)。图7a的弹性网络分析显示LIMA1等基因具有显著风险系数。

多组学整合的边际效益

如表3所示,逐步添加拷贝数、突变特征等模态仅使Coxnet的C-index从0.666微增至0.675。值得注意的是,当排除基因表达时,随机生存森林(RSF)凭借处理分类变量的优势成为最佳替代方案(PFS C-index 0.638)。

生物学意义的潜空间

UMAP可视化(图3)证实128维嵌入能有效聚类相似风险患者。二维压缩模型则表现欠佳,说明潜空间维度是关键超参数。

SHAP解析的风险标志物

如图4所示,模型成功识别:1)1q21相邻基因PSMD4/RFX5(拷贝数增益使风险评分+0.25);2)APOBEC相关SBS2/13特征(+0.15);3)保护性19p13扩增(-0.1)。图5的Cox模型进一步验证PSMD4拷贝数增益使PFS风险比达1.70(p=0.021)。

外部验证的稳健性

如表2所示,在微阵列队列中MyeVAE保持稳定性能,尤其在Masaryk E-MTAB-4032数据集实现PFS的C-index 0.609,克服了部分GEP标志物C-index<0.5的失效问题。

讨论部分指出,虽然多组学整合未带来预测性能的显著提升,但VAE框架成功实现了三方面突破:1)建立首个可解释的MM多组学风险模型;2)发现PSMD4等新型风险基因;3)证实转录组是最接近临床表型的组学层。研究同时揭示了当前局限:APOBEC突变特征等已知高危因素尚未完全转化为预测效能,提示未来需要纳入突变矩阵、PET/CT影像等更多维度数据。

这项研究为血液肿瘤的AI辅助诊断树立了新范式。MyeVAE不仅提供优于传统GEP标志物的预测性能,其SHAP驱动的可解释性更为生物标志物发现开辟了新途径。随着单细胞测序和空间组学发展,这种深度学习框架有望进一步解锁MM异质性的分子密码,最终实现真正的个体化治疗。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号