
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于微阵列基因指纹分析和人工神经网络的髓母细胞瘤分子亚型精准分类研究
【字体: 大 中 小 】 时间:2025年07月26日 来源:Computational and Structural Biotechnology Journal 4.5
编辑推荐:
研究人员针对髓母细胞瘤(MB)分子分型在资源有限地区的应用难题,开发了基于微阵列基因表达数据和人工神经网络(ANN)的分类模型。通过Kruskal-Wallis和χ2检验筛选特征基因,结合dPCR验证,实现了WNT/SHH/G3/G4亚型96%的分类准确率,为开发便携式分子诊断工具奠定基础。
在儿童脑肿瘤领域,髓母细胞瘤(MB)是最常见的恶性脑瘤,占所有儿童中枢神经系统恶性肿瘤的20%。尽管世界卫生组织(WHO)在2021年已将MB细分为12个分子亚型,但临床上仍主要采用WNT、SHH、Group 3(G3)和Group 4(G4)这四种分子亚型分类。准确区分这些亚型对制定个体化治疗方案至关重要,然而在资源有限地区,DNA甲基化芯片等标准诊断技术难以普及。特别是G3和G4亚型,占所有病例60%以上且预后最差,但二者分子特征存在重叠,传统免疫组化标记难以区分。
为解决这一临床难题,来自墨西哥国立儿科研究所(Instituto Nacional de Pediatría)和墨西哥城费德里科·戈麦斯儿童医院(Hospital Infantil de México Federico Gómez)的研究团队创新性地将人工智能与分子生物学技术相结合。他们开发的人工神经网络(ANN)模型通过分析微阵列基因表达数据,不仅实现了MB亚型的高精度分类,还鉴定出可用于诊断的最小基因组合。这项突破性研究发表在《Computational and Structural Biotechnology Journal》上,为开发经济高效的MB分子诊断工具提供了新思路。
研究人员采用多阶段研究策略:首先从Gene Expression Omnibus数据库获取Affymetrix微阵列数据,筛选出1937个差异表达基因;然后构建包含输入层(1937个基因)、三个隐藏层(600-750个神经元)和输出层的ANN架构;通过Kruskal-Wallis和χ2检验进行特征选择;最后用数字PCR(dPCR)在22例MB肿瘤样本中验证关键基因的表达模式。研究特别关注了G3和G4亚型,因其临床鉴别难度大且预后差。
研究结果部分,在"ANN架构"部分,五分类模型对WNT/SHH/G3/G4和对照组的平均分类准确率达96%,其中最难区分的G3亚型准确率为90%。采用差异表达数据训练时,准确率进一步提升至97.2%。在"特征提取及其相对重要性"部分,通过统计检验鉴定出各亚型前10位特征基因,如G3的CALR、INPP5A和G4的DYNLT1、SYT2等。值得注意的是,已知MB标志物OTX2在WNT和G4亚型中均被检出。
在"dPCR分析实验样本"部分,研究人员验证了关键基因在22例临床样本中的表达模式。结果显示CALR在G3样本中高表达(最高7.9 copies/μL),而SYT2在G4样本中特异性高表达(最高0.46 copies/μL)。特别值得关注的是,已知的WNT标志物EMX2在WNT样本M17中表达量高达39.18 copies/μL,显著高于其他亚型。
在"通过dPCR对MB分类器进行稳健验证"部分,研究证实即使将特征基因数量从1937个缩减至16个,ANN模型仍保持92%的平均准确率。使用dPCR实验数据测试时,对G3和G4亚型的分类准确率分别为88.2%和86%,虽略有下降但仍保持较高水平,表明模型具有良好的泛化能力。
这项研究的重要意义在于建立了一个整合计算生物学和实验验证的研究框架。通过ANN模型筛选出的最小基因组合不仅具有理论价值,更具备转化为实际诊断工具的潜力。特别是鉴定出的CALR、SYT2等新型标志物,为开发针对资源有限地区的便携式MB诊断方法提供了分子基础。研究采用的dPCR技术相比传统qPCR具有更高灵敏度和准确性,适合临床样本检测。未来,这些发现可进一步转化为基于核酸的生物传感器,实现MB亚型的快速、经济分型。此外,该研究方法可推广至其他癌症的分子分类,为精准医疗提供新思路。
生物通微信公众号
知名企业招聘