编辑推荐:
为解决 PLGA 微颗粒(MPs)研发难题,研究人员汇编相关数据集,助力 MP 设计与机器学习模型开发。
在医学领域,药物递送系统就像是精密的 “快递员”,负责将药物精准、高效地送达身体的各个 “目的地”,从而发挥治疗作用。其中,聚合物微颗粒(MPs)作为一种长效注射(LAI)制剂,凭借着能够实现治疗药物的持续释放这一特性,成为了慢性病治疗的 “得力助手”。它不仅可以改善药物的药代动力学,让药物在体内更稳定地发挥作用,还能提高患者的依从性,大大减轻患者频繁服药的负担。
在众多用于制备 MPs 的聚合物材料中,聚乳酸 - 羟基乙酸共聚物(PLGA)脱颖而出,成为了 “黄金标准” 材料。它具有良好的生物相容性(能与人体组织和谐共处,减少免疫反应)、可调节性(能根据需求调整性能)以及生物可降解性(在完成使命后能逐渐分解排出体外),许多 FDA 批准的聚合物 MP 药物产品都以它为原料,像治疗激素相关疾病的 Lupron Depot?、管理 2 型糖尿病的 Bydureon? 以及缓解骨关节炎症状的 Zilretta? 等。
然而,PLGA MPs 的研发之路并非一帆风顺。自 1989 年首个 PLGA MP 药物获批以来,仅有约十种成功上市。其中一个关键的阻碍就是其高维的配方设计空间。MPs 的研发需要尝试大量辅料和配方参数的组合,然后对制备出的 MPs 进行分析,筛选出性能优良的候选产品,这一过程涉及到粒子大小、药物载量和药物释放曲线等多个性能指标。但由于配方设计空间过于复杂,且药物研究耗时费力,想要全面评估所有潜在的 MPs 几乎是不可能的。这就导致研究人员往往只能聚焦在有限的配方参数范围内进行优化,例如现有研究大多集中在乳酸(LA)与羟基乙酸(GA)比例为 1:1 或 3:1 、聚合物分子量在 12 至 75kDa 的 PLGA 上。但不同药物有不同特性,为一种药物优化的配方未必适用于其他药物,这种有限的探索可能会导致配方开发不理想,最终影响药物性能。
为了打破这一困境,来自多伦多大学莱斯利?丹药学院(Leslie Dan Faculty of Pharmacy, University of Toronto)等机构的研究人员 Zeqing Bao、Jongwhi Kim 等人开展了一项研究,相关成果发表在《Scientific Data》上。他们汇编了一个关于 PLGA MPs 配方参数和特性的数据集,旨在为未来 MPs 的设计提供参考,并为机器学习(ML)模型开发提供数据支持。
研究人员在开展这项研究时,主要运用了以下几种关键技术方法:
- 数据收集:从 Web of Science 数据库中检索 PLGA MP 研究相关文献,通过特定关键词搜索,并排除不相关术语,将范围限定在研究论文。之后,手动筛选论文,依据一系列标准确定最终纳入的文献,从这些文献中收集相关描述符数据,利用 WebPlotDigitizer 软件提取药物释放数据,从特定数据库收集药物的简化分子线性输入规范(SMILES)字符串24。
- 数据处理与分析:进行特征工程,添加药物的分子量、拓扑极性表面积(TPSA)和 LogP 等描述符,通过相关计算库基于药物 SMILES 字符串计算得出。还进行数据清洗,去除非数值描述符。利用小提琴图和热图分别对数据集特征分布和相关性进行分析56。
下面来具体看看研究结果:
- 数据集概况:该数据集包含 321 个体外 PLGA MP 释放实验和 4913 个体外释放时间点,数据来源于 113 篇出版物,涵盖 89 种不同药物,是目前最广泛的关于载药 PLGA MPs 的开放数据集。数据集包含众多配方描述符,如药物名称、聚合物分子量、LA/GA 比例等,为后续研究提供了丰富信息13。
- 数据集特征分布:通过小提琴图展示数据集特征分布,发现多数数据点集中在一定范围内,例如大部分研究集中在特定的聚合物分子量和 LA/GA 比例区间,这也反映了当前研究的局限性7。
- 数据集特征相关性:计算皮尔逊相关系数(PCCs)并绘制热图分析特征相关性,发现除时间外,配方特征与药物释放的皮尔逊相关性较低,表明它们之间的关系可能复杂、多维且非线性6。
在研究结论和讨论部分,这个数据集的重要意义得以凸显。它为研究人员提供了一个全面的参考,有助于他们更好地理解当前 PLGA MP 的设计空间,从而在研发新的 MPs 时能够更有针对性地选择配方参数,提高研发效率。同时,该数据集为机器学习模型的开发提供了丰富的数据资源,机器学习可以利用这些数据更高效地探索药物配方设计空间,加速新型 MPs 的研发进程。此外,数据集的开放访问也鼓励了科研社区的广泛使用,为未来研究纳入其他聚合物和剂型奠定了基础,有望推动整个药物递送领域的发展,为更多患者带来更有效的治疗方案。