基于机器学习预测埃塞俄比亚成年HIV阳性患者抗逆转录病毒治疗依从性状态的研究

【字体: 时间:2025年07月12日 来源:BMC Medical Informatics and Decision Making 3.3

编辑推荐:

  本研究针对埃塞俄比亚德布雷马科斯综合专科医院HIV患者抗逆转录病毒治疗(ART)依从性预测难题,通过机器学习模型分析4640例患者临床数据,开发出梯度提升算法(Accuracy=0.78, AUC=0.76)预测模型,识别出年龄、治疗方案(Regimen)、WHO分期等10个关键预测因子,为资源有限地区优化HIV管理提供智能化决策工具。

  

在埃塞俄比亚,HIV仍是重大公共卫生挑战,全国约61.7万感染者中,每年有1.1万例HIV相关死亡。尽管抗逆转录病毒治疗(ART)覆盖率已达70-80%,但治疗依从性不足导致病毒抑制失败、CD44细胞计数下降和耐药性产生等问题持续存在。传统通过门诊随访和患者自述的依从性评估方法可靠性有限,且资源匮乏地区缺乏有效预警系统。德布雷马科斯大学健康科学学院的研究团队通过分析2005-2024年4640例ART患者数据,首次在埃塞俄比亚应用机器学习建立依从性预测模型。

研究采用SMOTE技术处理1.9%低依从性样本的类别不平衡问题,比较支持向量机(SVM)、随机森林等7种算法后发现,梯度提升(Gradient Boosting)模型表现最优(测试集Accuracy=78%,Recall=76%)。特征重要性分析揭示每日ART剂量、WHO分期(Stage I-IV)和CD44>500 cells/mm3等临床指标是关键预测因子。该成果发表于《BMC Medical Informatics and Decision Making》,为实施精准干预提供数据支持。

方法学亮点

  1. 数据预处理:对德布雷马科斯综合专科医院SMART care系统提取的13维特征进行缺失值填补(数值型取均值,分类变量取众数)和SMOTE过采样
  2. 模型构建:采用十折交叉验证比较7种算法,最终选择未调参的默认梯度提升模型
  3. 特征编码:对病毒载量(0=抑制/<50 copies/ml,1=未抑制)等分类变量进行独热编码

主要结果

  1. 人群特征:63.56%为女性,平均年龄41.8±11.5岁,94.38%病毒载量受抑制,82.59%处于WHO I期
  2. 模型比较:梯度提升在平衡数据后各项指标显著提升(F1-score从0.83→0.98)
  3. 预测效能:测试集混淆矩阵显示对"不良依从性"的识别精确度达79.6%
  4. 关键因子:治疗方案(如1j=TDF+3TC+DTG)和体重(<50kg=0)影响强度超CD44计数

讨论与意义
该研究突破传统统计方法局限,首次证实机器学习在埃塞俄比亚HIV管理中的适用性。虽然样本中仅1.9%存在依从性问题,但模型成功识别出76%的真实阳性案例,这对早期发现高风险患者至关重要。值得注意的是,与南非(Nigeria)研究相比,该模型对"每日服药剂量"特征赋予更高权重,反映用药复杂性在资源匮乏地区的特殊影响。作者建议将模型整合至电子病历(EMR)系统,结合WHO分期动态更新预测结果。局限在于未纳入社会经济等行为因素,未来可通过移动健康(mHealth)数据补充完善。这项成果为实现联合国"95-95-95"目标提供了关键技术支撑。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号