编辑推荐:
在动物福利备受关注、动物实验受限的背景下,研究人员开展皮肤致敏评估的非动物替代方法研究。构建基于规则模型、LLNA 和 GPMT 统计模型的共识模型,结果显示多数投票模型平衡准确率达 78% ,为皮肤致敏评估提供新途径。
在现代生命科学和健康医学领域,皮肤致敏评估是毒理学研究的重要一环。传统上,皮肤致敏的潜在性评估主要依赖于体内(
in vivo)动物实验,比如使用小鼠进行的局部淋巴结检测(local lymph node assay,LLNA) 。然而,随着动物福利意识的不断提高,以及全球范围内对动物实验限制和禁令的逐步推行,这种依赖动物的实验方法面临着巨大挑战。从动物福利的角度出发,减少动物实验的呼声日益高涨,美国环境保护署甚至发布指令,要求到 2035 年消除所有哺乳动物测试请求和资金支持。这一背景下,开发准确可靠的非动物替代方法成为了科研人员亟待解决的问题。
在此关键节点,科研人员积极探索,来自未知研究机构的研究人员开展了一项具有重要意义的研究,相关成果发表在《Computational Toxicology》杂志上。他们致力于构建一种全新的皮肤致敏评估模型,以替代传统动物实验方法。研究人员通过深入研究,构建了基于三种不同独立皮肤致敏关键事件(Key Event,KE)/ 不良结局(Adverse Outcome,AO)的共识模型,该模型整合了基于规则的模型、基于 LLNA 统计的模型以及基于豚鼠最大化试验(guinea pig maximization test,GPMT)统计的模型。研究结果令人振奋,构建的共识模型在对化学物质的皮肤致敏性预测中表现出色,其中多数投票模型的平衡准确率高达 78%,这一成果为皮肤致敏评估领域开辟了新的道路,具有重要的科学意义和实际应用价值。
为开展此项研究,研究人员运用了多种关键技术方法。在数据处理方面,收集了大量的化学物质数据,包括 LLNA、GPMT 和人体测试数据集,并对数据进行了严格筛选和处理,去除混合物、无机和有机金属化合物,中和盐类,确保数据质量。在模型构建上,基于规则的模型依据 KE1,结合文献和毒性数据库知识确定警报结构,并利用自定义的代谢模拟规则模拟化学物质在皮肤表面的代谢反应;统计模型则基于 KE4 和 AO,分别以 LLNA 和 GPMT 数据集为基础,使用 RDKit 计算化学物质描述符,借助 LightGBM 进行建模,通过 10 折交叉验证和 Optuna 优化超参数 。最后,构建了逻辑或、多数投票和逻辑与三种共识模型,综合评估化学物质的皮肤致敏性。
下面来看具体的研究结果。首先是对基于规则模型的评估。研究人员在 LLNA 和 GPMT 数据集上对基于规则且包含代谢过程的模型进行性能评估,结果显示其在 LLNA 数据集上灵敏度为 68%,特异性为 75%,平衡准确率为 71%,准确率为 72%;在 GPMT 数据集上,相应指标分别为 55%、73%、64% 和 66% 。这表明该模型在不同数据集上均有一定的预测能力。进一步探究代谢模型对基于规则模型的影响时发现,对于前半抗原和半抗原前体的预测,包含代谢模型的规则模型优势明显。在 DASS LLNA 化学物质数据集中,不含代谢模型的规则模型仅能对 29 种化学物质中的 14 种预测出阳性结果,而包含代谢模型的规则模型则能对全部 29 种化学物质预测出阳性结果,有力证明了代谢模型的重要性。
在评估 LLNA 和 GPMT 统计模型时,通过 10 折交叉验证,发现 LLNA 统计模型灵敏度为 67%,特异性为 76%,平衡准确率为 71%,准确率为 72%;GPMT 统计模型的相应指标分别为 65%、78%、71% 和 73% 。两个模型均表现出特异性高于灵敏度的特点,研究人员认为这与训练数据中非致敏剂数量多于致敏剂有关。针对构建模型与其他方法的预测准确性对比,在 DASS LLNA 化学物质数据集上,包含代谢模型的规则模型平衡准确率最高,达 88% 。与 Derek Nexus 和 OECD QSAR Toolbox 相比,研究人员构建的模型能对所有化学物质进行预测,且均在适用域内,展现出良好的性能。在 DASS 人体测试化学物质数据集上,多数投票模型平衡准确率最高,达 78%,逻辑或模型准确率最高,为 86% 。同样,与其他对比软件相比,研究人员的模型在预测化学物质方面具有优势,能对所有化学物质进行预测且均在适用域内。
研究结论与讨论部分,研究人员构建的基于代谢模拟器的规则模型具有独特优势。它能将前半抗原和半抗原前体转化为活性代谢物结构,进而预测其皮肤致敏性。与其他类似工具不同,该模型会以树形结构展示结构转化过程,让用户清晰了解包含潜在致敏结构的信息。LLNA 和 GPMT 统计模型虽平衡准确率为 71%,但使用的数据集规模更大,涵盖 1953 种化学物质的 LLNA 数据集和 2955 种化学物质的 GPMT 数据集,相比以往研究,其适用性更广。而共识模型综合了三种不同的 KE/AO 和两种方法,多样性高,在人体测试数据上平衡准确率高达 78% 。该模型中的多数投票和逻辑与模型类似于 “2 out of 3” 定义方法(2o3 DA),但又具有成本低、预测快的优势,还能明确区分化学物质在三种测试中的不同情况。
综上所述,此项研究成功构建了用于皮肤致敏评估的共识模型,为非动物替代方法在皮肤致敏评估领域的应用提供了有力支持。研究成果不仅有助于减少动物实验的使用,还为化学物质和药品的皮肤致敏性评估提供了更高效、准确的工具,在生命科学和健康医学领域具有重要的推动作用,有望在未来的毒理学研究和相关产品安全性评估中得到广泛应用。