基于深度残差网络与代谢特征谱的甲状腺癌分化状态分类系统开发及其多组学整合研究
【字体:
大
中
小
】
时间:2025年09月26日
来源:npj Digital Medicine 15.1
编辑推荐:
本研究针对甲状腺癌分化状态诊断难题,创新性地整合代谢组学、转录组学和基因组学数据,构建了基于深度残差网络(ResNet)的甲状腺癌分化状态分类系统。研究人员通过对158例甲状腺肿瘤和57例配对正常组织进行多组学分析,结合单细胞RNA测序数据,揭示了去分化过程中的关键代谢重编程通路,并建立了基于10个代谢基因(10MG)和10个代谢物(10M)特征的精准分类模型。该研究实现了对甲状腺癌不同分化状态(包括高分化、低分化和未分化)的准确区分(平均准确率92.7%,AUC达0.98),为甲状腺癌的早期诊断和临床决策提供了重要的理论依据和技术支撑。
甲状腺癌是全球范围内发病率增长最快的恶性肿瘤之一,其中高分化甲状腺癌(WDTC)占绝大多数,包括乳头状甲状腺癌(PTC)和滤泡状甲状腺癌(FTC),通常预后良好。然而,去分化甲状腺癌(DDTC),包括低分化甲状腺癌(PDTC)和未分化甲状腺癌(ATC),虽然发病率较低,却极具侵袭性,尤其是ATC的中位生存期仅约5个月,一年生存率低至20%,成为临床治疗的重大挑战。
目前,甲状腺癌的诊断主要依赖细针穿刺活检(FNA),但由于肿瘤组织的异质性和去分化形态的不典型性,其诊断准确性有限,尤其在区分PDTC和ATC时存在较大困难。传统的甲状腺分化评分(TDS)难以有效区分这两种高度恶性的亚型,导致患者可能错过最佳治疗时机。此外,去分化过程的分子机制复杂,涉及遗传变异、代谢重编程和肿瘤微环境重塑等多个层面,但既往研究往往受限于样本量不足、病理亚型覆盖不全以及分析方法不够精准等问题。
为此,复旦大学附属肿瘤医院头颈外科的研究团队在《npj Digital Medicine》上发表了最新研究成果,他们通过整合多组学数据和先进的人工智能算法,开发了一套基于深度残差网络(ResNet)的甲状腺癌分化状态分类系统,为解决这一临床难题提供了新的思路和方法。
研究人员主要采用了以下关键技术方法:1)收集158例甲状腺癌患者(包括PTC、FTC、PDTC和ATC)及57例配对正常组织样本,进行全外显子测序(WES)、转录组测序和非靶向代谢组学检测;2)整合GEO数据库中的单细胞RNA测序数据(GSE193581),分析不同细胞群体的代谢特征;3)应用深度残差网络(ResNet)构建分类模型,并通过SHAP(Shapley Additive Explanations)进行特征可解释性分析;4)采用生存分析、通路富集分析(KEGG、SMPDB)、趋势聚类(Mfuzz)等生物信息学方法验证结果的生物学意义。
研究队列包含215个样本,平均年龄45.92±16.25岁,平均肿瘤大小3.52±1.97 cm。多组学分析显示,DDTC组与WDTC组相比,具有更大的肿瘤体积、甲状腺外侵犯(ETE)、淋巴结外侵犯(ENE)和远处转移(DM)等临床特征。基因突变分析发现,TP53和TERT启动子突变(C228T和C250T)在DDTC中最为常见,其中TERT C250T突变与放射性碘(RAI)耐药性和ATC发生显著相关。
研究共注释512种极性代谢物和脂质,发现TERT C250T突变与脂质代谢改变密切相关。Welch t检验显示,PI3KCA突变与犬尿氨酸(KYN)和S-腺苷同型半胱氨酸(SAH)水平呈正相关,而TERT C250T突变与氨基酸、肽和脂肪酸(FA)水平显著相关。基因融合事件中,AC026191.1_SRGAP3融合与NADH丰度呈正相关。
单变量和多变量Cox分析均表明,分化状态是影响患者总生存期(OS)的最显著因素。Kaplan-Meier生存曲线显示,ATC患者预后最差,而WDTC和DDTC患者的生存率存在显著差异(p<0.0001)。传统TDS评分无法有效区分PDTC和ATC,突显了开发新分类模型的必要性。
通过稀疏偏最小二乘判别分析(sPLS-DA)和正交偏最小二乘判别分析(OPLS-DA),研究发现DDTC与WDTC之间存在显著的代谢差异。单样本基因集富集分析(ssGSEA)显示,甲状腺素生物合成通路在FTC和PTC中活性最高,而在PDTC和ATC中活性最低,表明去分化过程中正常滤泡上皮细胞功能逐渐丧失。此外,NADPH和NADH在WDTC中丰度较高,而在DDTC中显著降低,提示细胞能量状态和氧化还原能力的变化。
KYN在ATC中显著积累,色氨酸代谢通路在ATC的免疫微环境中发挥关键作用。单细胞分析发现,KYNU在单核细胞、巨噬细胞和树突状细胞(DCs)中高表达,而TDO2在成纤维细胞中上调,表明色氨酸代谢主要通过免疫和基质细胞参与肿瘤微环境调节。
通过整合mRNA表达和代谢物丰度数据,研究揭示了去分化过程中独特的代谢重编程变化。关键代谢物和基因的网络分析显示,核苷酸代谢、氨基酸代谢和脂质代谢通路在去分化过程中发生显著改变,其中PNP和NT5E是网络中的核心节点。
研究整合了GEO数据库中的多个转录组数据集(GSE29265、GSE33630、GSE53157、GSE65144、GSE76039),通过ResNet框架构建了基于10个代谢基因(GPX3、TPO、CYP1B1、PDE8B、MGAT4B、DHRS3、ALOX5、PDE5A、NT5E和ST3GAL1)的分类模型。该模型在区分不同分化状态时表现出色,平均准确率达92.7%,AUC值介于0.87至0.96之间。SHAP分析进一步验证了这些基因在分类中的重要性。
基于代谢物丰度数据,研究还开发了10代谢物分类模型,包括PC(17:0_24:0)、PC(36:4)、Hex1Cer(d18:1_22:0)、N-乙酰天冬氨酸、ADP-核糖、核糖-5-磷酸、1-甲基烟酰胺、PC(32:1)、UDP-葡萄糖和ChE(20:3)。该模型在FUSCC队列中实现了平均AUC 0.98的性能,能够有效区分PDTC和ATC。
本研究通过多组学整合和深度学习建模,首次系统揭示了甲状腺癌去分化过程中的代谢重编程特征,并成功构建了高精度的分化状态分类系统。这不仅深化了对甲状腺癌恶性进展机制的理解,还为临床诊断提供了新的生物标志物和分类工具。10代谢基因和10代谢物模型的建立,克服了传统诊断方法的局限性,尤其在对PDTC和ATC的区分上表现出显著优势。
此外,研究发现的色氨酸代谢通路在ATC免疫微环境中的重要作用,为开发新的靶向治疗策略提供了潜在方向。例如,针对TDO2和KYNU的抑制剂可能成为治疗ATC的新选择。同时,研究中所采用的ResNet框架和SHAP可解释性分析方法,为其他癌症类型的多组学研究提供了可借鉴的技术路线。
总之,这项研究不仅推动了甲状腺癌精准医疗的发展,也为多组学数据整合和人工智能在医学中的应用提供了重要范例。未来,通过更大规模的临床验证和技术优化,这一分类系统有望成为甲状腺癌诊断和治疗决策的有力工具,最终改善患者预后。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号