
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于集成机器学习(XGBoost与随机森林)与遗传算法预测治疗剂脂质体包封效率的关键因素研究
《Nanoscale》:Leveraging ensemble machine learning models (XGBoost and random forest) and genetic algorithms to predict factors contributing to the liposomal entrapment of therapeutics
【字体: 大 中 小 】 时间:2025年09月16日 来源:Nanoscale 5.1
编辑推荐:
本研究针对脂质体药物递送系统中治疗剂包封效率(EE%)的关键影响因素预测难题,来自未知机构的研究人员采用集成机器学习方法(结合随机森林、XGBoost和遗传算法),通过对500个数据点的分析,利用可解释人工智能技术揭示了水溶性、粒径、胆固醇/磷脂摩尔比等核心参数对EE%的调控机制,为优化脂质体配方设计提供了智能化解决方案。
脂质体被公认为安全可生物降解的药物递送系统,能将治疗剂精准运抵目标部位。在应用前需对脂质体进行表征,其中包封效率(Entrapment Efficiency, EE%)——即药物被脂质体包裹的百分比——是重要参数,尤其对昂贵药物和原料意义重大。人工智能(AI)与机器学习技术可辅助分析大数据集并预测结果,从而优化药物递送系统特性。本研究采用集成机器学习策略,结合随机森林(Random Forest)、XGBoost和遗传算法(Genetic Algorithm),基于包含500个数据点的数据集,评估了载药特性与载体因素对治疗剂EE%的影响机制,并通过可解释AI(Explainable AI)解读结果。研究发现:对所有药物而言,影响脂质体EE%的关键因素排序为水溶性、粒径、胆固醇/磷脂摩尔比(Cholesterol/Phospholipid Molar Ratio)和药物/脂质摩尔比(Drug/Lipid Molar Ratio);若仅分析logP > 1的药物,关键因素依次为水溶性、logP、相变温度(Phase Transition Temperature, Tm)和粒径;而对logP < 1的药物,核心因素则为水溶性、胆固醇/磷脂摩尔比、logP和粒径。统计分析证实遗传算法可有效优化树状机器学习模型,该策略有望为不同载药的脂质化参数筛选提供智能化支持。