
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的新型铁缺乏评估方法BamClassifier的开发与验证
【字体: 大 中 小 】 时间:2025年09月04日 来源:Scientific Reports 3.9
编辑推荐:
本研究针对铁缺乏(ID)诊断中存在的症状非特异性、检测方法灵敏度不足等问题,开发了基于全血细胞计数(CBC)参数的机器学习方法BamClassifier。该方法通过中位数补充采样和预测聚合技术,在加纳真实数据集和模拟数据中均实现了100%的AUC值,显著提升了ID评估的准确性(94%以上)、灵敏度(89%)和诊断比值比(最高268),为标准化铁缺乏诊断提供了高效计算工具。
铁缺乏(ID)是全球范围内普遍存在的营养健康问题,尤其影响儿童、育龄妇女以及低收入国家人群。作为贫血的主要诱因,ID还会导致体力下降、认知功能障碍等一系列健康问题。然而当前临床诊断面临三大困境:症状表现缺乏特异性,传统检测方法如血清铁蛋白(SF)易受炎症干扰,骨髓活检作为金标准又存在侵入性强、操作复杂等缺点。现有实验室指标如锌原卟啉(ZnPP)、转铁蛋白饱和度等均存在灵敏度或特异性不足的问题,迫切需要开发更可靠的评估手段。
针对这一临床需求,Emmanuel S. Adabor等研究团队在《Scientific Reports》发表研究,开发了名为BamClassifier的机器学习新方法。该方法创新性地结合了中位数补充采样(median-supplement)和预测聚合技术,仅需常规全血细胞计数(CBC)参数即可实现高精度ID评估。研究采用加纳两个真实人群数据集(188例献血者和316例未生育女性)进行验证,并与随机森林、朴素贝叶斯等传统算法进行对比。
关键技术方法包括:1) 采用无放回的均衡子采样策略确保每个样本参与建模;2) 基于拉丁超立方体采样的中位数补充技术平衡类别差异;3) 构建中位数补充朴素贝叶斯模型进行预测;4) 通过"预测袋"共识机制确定最终分类。所有实验均通过4折交叉验证,并采用bootstrap法评估模型稳定性。
【BamClassifier准确评估铁缺乏】研究结果显示,在男性献血者数据中,新方法获得86%的灵敏度(95%CI 0.81-0.91)和96%的特异性,诊断比值比(DOR)高达139.33,显著优于对比方法。在未生育女性数据中,虽然朴素贝叶斯灵敏度略高(90%),但BamClassifier以97%的特异性和94%的精准度展现全面优势,DOR达到268。
【稳定性与鲁棒性评估】通过100次bootstrap抽样验证,模型各项指标标准差均低于0.07,95%置信区间范围窄,显示极强稳定性。在模拟数据测试中,即使面对90:10的类别不平衡或加入5%特征噪声,模型仍保持99%以上的准确度和1.0的AUC值,Gamma分布数据测试同样表现优异。
【性能全面超越现有方法】在所有实验中,BamClassifier的AUC值均达到完美的100%,而文献报道的同类最佳方法最高仅92%。与传统方法相比,新方法在准确度(提升8-15%)、灵敏度(提升50-80%)等关键指标上均有显著改进,且不需要CRP等额外检测指标。
这项研究的重要意义在于:首先,BamClassifier首次将中位数补充采样与集成学习相结合,为处理医学数据类别不平衡问题提供了新思路;其次,仅需常规CBC参数即可实现高精度诊断,特别适合医疗资源有限地区推广;最后,模型在加纳人群中的优异表现证实其跨人群适用性。研究者特别指出,该方法可扩展至其他二分类医学诊断问题,但需注意其当前设计对标签分布差异的依赖性。这项成果为铁缺乏的标准化筛查提供了可靠工具,有望改善当前诊断不足的现状,对公共卫生实践具有重要价值。
生物通微信公众号
知名企业招聘