应用机器学习预测A型血友病严重程度:基于FVIII点突变特征与多模型比较研究

【字体: 时间:2025年09月20日 来源:Current Research in Translational Medicine 3

编辑推荐:

  本综述探讨了利用机器学习(ML)技术基于凝血因子VIII(FVIII)点突变数据预测A型血友病严重程度(轻、中、重)的创新方法。研究采用随机森林(RandomForest)、XGBoost等多模型嵌套交叉验证,达成65.5%预测准确率,显著优于基线模型(51.1%),为无创诊断替代传统血液检测(FVIII测量)提供新视角,推动罕见病研究进展。

  

Section snippets

Description of hemophilia characteristics and need for diagnostic improvement

血友病严重程度根据凝血因子活性水平分为轻度、中度或重度。重度病例存在致命性自发性出血的重大风险,需持续护理与特异性治疗。传统治疗通过补充缺乏的凝血因子实现,但高昂治疗成本(尤其对重度患者)仍是重大挑战。

Dataset description and data analysis

本节介绍了本研究所用数据集及其特征分析。

Proposal and experimental methodology

本实验采用Python编程语言及其sklearn机器学习包,流程包含:(1)分类器、指标与统计检验定义;(2)数据预处理;(3)模型训练与评估。

Results

本节展示实验结果,通过指标对比与统计差异分析确定最佳分类模型。

表2呈现全部10个超参数优化分类器的结果,可见标准化处理未对结果产生显著影响。表3则展示各类别的阳性预测值(PPV)与阴性预测值(NPV)。

表2结果还表明...

Conclusions

本研究基于Lopes等人先前工作,沿用其数据集但将分类目标扩展为三种严重程度(而非两种)。采用3轮10折嵌套交叉验证的网格搜索(而非单纯10折交叉验证),额外评估了K近邻、AdaBoost、Bagging、梯度提升与LightGBM等分类器,并引入更多评估指标以确保对不平衡数据集更全面的性能评估。

Data availability

本研究所收集数据集及开发代码已公开于GitHub:https://github.com/danieldealmeidaduque/using-ml-to-predict-hemophilia-a-severity

Funding statement

作者声明未获得任何组织对本次研究的资助。

Institutional review board statement

不适用。

Informed consent statement

作者声明同意出版。

Declaration of generative AI and AI-assisted technologies in the writing process

论文准备期间,作者使用ChatGPT优化语言与可读性。使用后作者对内容进行了必要审查与编辑,并对出版物内容承担全部责任。

CRediT authorship contribution statement

Daniel de Almeida Duque: 初稿撰写、软件、资源、方法、数据整理、概念化;Débora Dummer Meira: 评审编辑、可视化、验证、监督、形式分析;Lorena Souza Castro Altoé: 评审编辑、可视化;Matheus Correia Casotti: 评审编辑、可视化;Tiago José da Silva Lopes: 验证、监督、软件、形式分析;Iuri Drumond Louro: 可视化、验证...

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号