编辑推荐:
本文对比了群体药代动力学(PPK)、贝叶斯、机器学习(ML)及混合 PPK - ML 模型预测脓毒症患者万古霉素 24 小时血药浓度曲线下面积(AUC24)的性能。发现无浓度数据时混合模型最佳,有浓度数据时贝叶斯模型最佳,为精准用药提供策略。
### 一、研究背景
在重症监护病房(ICU)中,感染现象普遍,常进展为脓毒症,预后较差。万古霉素因治疗指数窄、个体差异大,确定其合适的暴露量对治疗脓毒症患者至关重要。目前常用的群体药代动力学(PPK)模型存在局限性,如依赖稀疏采样影响预测准确性,且在资源有限地区获取药物浓度存在困难。机器学习(ML)虽受关注,但存在假相关性和解释性差的问题。本研究旨在评估 PPK、贝叶斯、ML 和混合 PPK - ML 模型预测万古霉素 AUC
24的性能,为个体化用药提供指导。
二、材料和方法
- 数据收集:数据来自 MIMIC - IV 数据库,纳入 ICU 收治的脓毒症成年患者,这些患者在 ICU 住院期间使用过静脉万古霉素,住院时间超 24 小时且有万古霉素浓度测量值,排除接受肾替代治疗、孕妇等患者。收集的数据包括患者基线信息、实验室数据、万古霉素治疗方案及血药浓度、住院相关信息等。
- 数据处理:排除缺失数据超 20% 的变量,对剩余变量用 R 语言的 MICE 包以分类和回归树方法进行缺失值填补。将同一给药间隔内有峰谷浓度测量值的患者作为测试集,其余作为训练集。
- 群体药代动力学模型:采用非线性混合效应建模方法(NONMEM 7.5 版)开发 PPK 模型,从单室和双室一级消除模型中选择结构模型。用指数模型表示个体间随机效应,考虑多种残差变异性模型。通过逐步回归筛选协变量建立最终模型,并进行有效性评估,之后应用于测试集预测 Cmax和 Cmin浓度。
- 机器学习模型:开发 ML 模型和混合模型(结合 ML 与 PPK 模型),因训练数据集采样稀疏,以浓度为初始预测目标。用 mlr3 包对 8 种 ML 算法进行基准测试,选择预测性能最佳的两种算法。ML 模型纳入所有提取变量,混合模型额外纳入患者个体清除率(CL)和表观分布容积(V)。通过 10 折交叉验证、SHAP 方法、Boruta 方法及超参数调整确定最终模型并应用于测试集预测浓度。
- 暴露量计算:将模型预测的浓度数据转换为 AUC24,采用改良梯形法计算。用患者测试集的真实浓度计算 AUC24真实值,结合四种模型预测的 Cmax和 Cmin值计算预测的 AUC24。
- 模型性能比较:比较各模型预测的 AUC24与真实值,计算平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)、平均绝对百分比误差(MAPE)、R2及预测误差在 ±30% 内的比例(F30)评估模型性能。
三、研究结果
- 数据收集:共收集 4059 例符合条件的患者,53 例作为测试集,4006 例作为训练集。训练集患者的序贯器官衰竭评估(SOFA)评分显著高于测试集,测试集患者住院时间显著长于训练集,其他变量在两组间无显著差异。
- PPK 模型:基于训练集数据,采用单室一级吸收模型描述万古霉素浓度 - 时间分布,最终 PPK 模型包含肌酐清除率(CLCR)、Charlson 合并症指数(CCI)、患者体重(WT)等变量。模型预测准确性高、偏差低,参数估计可靠。
- 机器学习模型:在 ML 和混合模型的基准测试中,随机森林模型表现最佳。对于 ML 模型,其 R2为 0.2,MAE 为 0.66,RMSE 为 0.89,MSE 为 0.79;混合模型 R2为 0.4,MAE 为 0.57,RMSE 为 0.76,MSE 为 0.58。经超参数调整后,简单随机森林模型 R2升至 0.6,混合模型 R2升至 0.7。
- 模型比较:在测试集 AUC24预测中,贝叶斯模型误差最小,准确性和稳定性最佳,其次是混合模型和随机森林模型,PPK 模型预测误差最大。当有万古霉素浓度数据时,贝叶斯模型 F30 达 94.2%,MAPE 为 13.37%;无浓度数据时,混合模型表现最佳,F30 为 76.9%,MAPE 为 28.52%。
四、讨论
- 模型性能分析:无万古霉素浓度数据时,混合模型预测 AUC24性能最佳;有浓度数据时,贝叶斯模型预测准确性最高。PPK 模型性能相对较差,因其依赖简化假设,且数据库数据稀疏采样限制了对药物暴露变异性的捕捉。
- ML 模型优势:ML 在医学领域应用广泛,随机森林模型在本研究中预测性能突出,能有效处理复杂临床数据,捕捉变量间非线性关系。
- 混合模型优势:将 PK 参数纳入 ML 模型构建的混合模型,相比 PPK 模型和无 PK 参数的 ML 模型,预测性能显著提升,MAPE 分别改善 58% 和 17%。
- 模型选择策略:有患者万古霉素浓度数据时,贝叶斯模型是合适选择;无浓度数据时,混合模型更具优势。
- 研究优势与局限:本研究通过整合 ML 方法提升 PPK 模型性能,全面比较多个模型。但存在局限性,如数据来自单中心,部分患者药物浓度数据稀疏,未考虑其他潜在算法,可能遗漏重要生理生化指标,无法计算部分患者 BMI,混合模型构建方法需进一步探索。
五、结论
本研究成功建立四种预测脓毒症患者万古霉素 AUC24的模型。无浓度数据时混合模型更准确,有浓度数据时贝叶斯模型表现最佳。该研究为临床脓毒症患者万古霉素治疗提供参考,且相关方法可能用于其他药物暴露量预测。