基于全基因组关联研究(GWAS)数据和机器学习方法的类风湿关节炎分类性能分析

【字体: 时间:2025年10月14日 来源:NATIONAL ACADEMY SCIENCE LETTERS-INDIA 1.3

编辑推荐:

  本研究针对类风湿关节炎(RA)与其他关节疾病症状重叠导致的早期诊断难题,开发了基于全基因组关联研究(GWAS)单核苷酸多态性(SNP)数据和机器学习(ML)的分类框架。通过整合随机森林、XGBoost等集成学习算法,最终模型准确率达97.89%(AUC=99.46%),并识别出HLA区域、PTPN22等关键基因位点,为RA遗传机制研究和临床诊断提供新方向。

  
类风湿关节炎(Rheumatoid Arthritis, RA)是一种具有显著遗传基础的复杂自身免疫性疾病。由于与其他关节疾病(如骨关节炎、银屑病关节炎、幼年特发性关节炎和痛风)存在症状重叠,其早期精准诊断面临挑战。本研究提出一种基于机器学习(Machine Learning, ML)的框架,利用全基因组关联研究(Genome-Wide Association Studies, GWAS)衍生的单核苷酸多态性(Single Nucleotide Polymorphism, SNP)数据对RA进行分类。研究团队收集并预处理了多类关节疾病数据集,训练了随机森林(Random Forest)、极端随机树(Extra Trees)、XGBoost和装袋(Bagging)分类器,并通过优化的软投票集成(Soft Voting Ensemble)进行模型融合。最终集成模型实现了97.89%的准确率和99.46%的AUC(曲线下面积)。特征重要性分析突显了基因间区和内含子变异(尤其位于6号染色体)的作用,支持了与HLA(人类白细胞抗原)区域的已知关联。此外,PTPN22、LINC02789、MTCO3P1和TSBP1-AS1等基因也被识别为重要贡献因子。该研究不仅展示了高性能预测能力,还为RA的遗传结构解析提供了有价值的信息。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号