基于全基因组关联研究(GWAS)数据和机器学习方法的类风湿关节炎分类性能分析
【字体:
大
中
小
】
时间:2025年10月14日
来源:NATIONAL ACADEMY SCIENCE LETTERS-INDIA 1.3
编辑推荐:
本研究针对类风湿关节炎(RA)与其他关节疾病症状重叠导致的早期诊断难题,开发了基于全基因组关联研究(GWAS)单核苷酸多态性(SNP)数据和机器学习(ML)的分类框架。通过整合随机森林、XGBoost等集成学习算法,最终模型准确率达97.89%(AUC=99.46%),并识别出HLA区域、PTPN22等关键基因位点,为RA遗传机制研究和临床诊断提供新方向。
类风湿关节炎(Rheumatoid Arthritis, RA)是一种具有显著遗传基础的复杂自身免疫性疾病。由于与其他关节疾病(如骨关节炎、银屑病关节炎、幼年特发性关节炎和痛风)存在症状重叠,其早期精准诊断面临挑战。本研究提出一种基于机器学习(Machine Learning, ML)的框架,利用全基因组关联研究(Genome-Wide Association Studies, GWAS)衍生的单核苷酸多态性(Single Nucleotide Polymorphism, SNP)数据对RA进行分类。研究团队收集并预处理了多类关节疾病数据集,训练了随机森林(Random Forest)、极端随机树(Extra Trees)、XGBoost和装袋(Bagging)分类器,并通过优化的软投票集成(Soft Voting Ensemble)进行模型融合。最终集成模型实现了97.89%的准确率和99.46%的AUC(曲线下面积)。特征重要性分析突显了基因间区和内含子变异(尤其位于6号染色体)的作用,支持了与HLA(人类白细胞抗原)区域的已知关联。此外,PTPN22、LINC02789、MTCO3P1和TSBP1-AS1等基因也被识别为重要贡献因子。该研究不仅展示了高性能预测能力,还为RA的遗传结构解析提供了有价值的信息。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号