
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习方法的炎症性乳腺癌患者基因表达谱鉴定及其临床意义
【字体: 大 中 小 】 时间:2025年08月08日 来源:Russian Journal of Genetics 0.5
编辑推荐:
【编辑推荐】来自未知机构的研究人员针对炎症性乳腺癌(IBC)这一致死率达7%的罕见亚型,通过XGBoost和随机森林(RF)算法分析GSE5847微阵列数据,从22?283个基因中筛选出19个关键基因(如EDN1、AR、REST等),并构建决策树(DDT)模型实现71.1%的F1-score和73.73%的AUC值,为IBC精准诊断提供新靶点。
这项开创性研究聚焦于致死性极高的炎症性乳腺癌(Inflammatory Breast Cancer, IBC),这种特殊亚型占乳腺癌死亡病例的7%。科研团队另辟蹊径,采用机器学习中的极限梯度提升(XGBoost)和随机森林(Random Forest, RF)双算法,对基因表达综合数据库(GEO)中编号GSE5847的微阵列数据进行深度挖掘。在22?283个候选基因中,通过严谨的算法筛选出19个与IBC密切相关的关键基因,包括内皮素1(EDN1)、核结合蛋白2(NUCB2)、抑制元件1沉默转录因子(REST)等明星分子。
研究过程充满科学趣味:首先通过独立样本t检验和曼-惠特尼U检验(Mann-Whitney U test)验证基因表达差异,惊喜地发现除CCL5等4个基因外,其余15个基因在IBC与非IBC组间均存在显著差异。随后构建的决策树(Decision Tree, DDT)模型更是展现出73.73%的曲线下面积(AUC)和71.1%的F1值,这个"基因侦探"成功解码了AR、UBE3A等基因在IBC分类中的生物学"密码"。
特别引人注目的是,该研究不仅停留在算法层面,更深入阐释了雄激素受体(AR)、神经元限制性沉默因子(REST)等关键基因的临床价值,为开发新型液体活检标志物提供了理论依据。这些发现如同为IBC诊疗迷宫点亮了多盏明灯,预示着精准医疗时代下机器学习与组学数据的完美联姻将开创癌症诊断新纪元。
生物通微信公众号
知名企业招聘