
-
生物通官微
陪你抓住生命科技
跳动的脉搏
应用机器学习预测A型血友病严重程度:基于FVIII点突变特征与多模型比较研究
【字体: 大 中 小 】 时间:2025年09月20日 来源:Current Research in Translational Medicine 3
编辑推荐:
本综述探讨了利用机器学习(ML)技术基于凝血因子VIII(FVIII)点突变数据预测A型血友病严重程度(轻、中、重)的创新方法。研究采用随机森林(RandomForest)、XGBoost等多模型嵌套交叉验证,达成65.5%预测准确率,显著优于基线模型(51.1%),为无创诊断替代传统血液检测(FVIII测量)提供新视角,推动罕见病研究进展。
Section snippets
Description of hemophilia characteristics and need for diagnostic improvement
血友病严重程度根据凝血因子活性水平分为轻度、中度或重度。重度病例存在致命性自发性出血的重大风险,需持续护理与特异性治疗。传统治疗通过补充缺乏的凝血因子实现,但高昂治疗成本(尤其对重度患者)仍是重大挑战。
Dataset description and data analysis
本节介绍了本研究所用数据集及其特征分析。
Proposal and experimental methodology
本实验采用Python编程语言及其sklearn机器学习包,流程包含:(1)分类器、指标与统计检验定义;(2)数据预处理;(3)模型训练与评估。
Results
本节展示实验结果,通过指标对比与统计差异分析确定最佳分类模型。
表2呈现全部10个超参数优化分类器的结果,可见标准化处理未对结果产生显著影响。表3则展示各类别的阳性预测值(PPV)与阴性预测值(NPV)。
表2结果还表明...
Conclusions
本研究基于Lopes等人先前工作,沿用其数据集但将分类目标扩展为三种严重程度(而非两种)。采用3轮10折嵌套交叉验证的网格搜索(而非单纯10折交叉验证),额外评估了K近邻、AdaBoost、Bagging、梯度提升与LightGBM等分类器,并引入更多评估指标以确保对不平衡数据集更全面的性能评估。
Data availability
本研究所收集数据集及开发代码已公开于GitHub:https://github.com/danieldealmeidaduque/using-ml-to-predict-hemophilia-a-severity
Funding statement
作者声明未获得任何组织对本次研究的资助。
Institutional review board statement
不适用。
Informed consent statement
作者声明同意出版。
Declaration of generative AI and AI-assisted technologies in the writing process
论文准备期间,作者使用ChatGPT优化语言与可读性。使用后作者对内容进行了必要审查与编辑,并对出版物内容承担全部责任。
CRediT authorship contribution statement
Daniel de Almeida Duque: 初稿撰写、软件、资源、方法、数据整理、概念化;Débora Dummer Meira: 评审编辑、可视化、验证、监督、形式分析;Lorena Souza Castro Altoé: 评审编辑、可视化;Matheus Correia Casotti: 评审编辑、可视化;Tiago José da Silva Lopes: 验证、监督、软件、形式分析;Iuri Drumond Louro: 可视化、验证...
生物通微信公众号
知名企业招聘