《Frontiers in Toxicology》:Bridging science and curriculum: preparing future leaders in computational toxicology
计算毒理学在药物发现、危害识别和监管安全评估中扮演着越来越重要的角色。这篇综述旨在弥合科学与课程之间的差距,为培养该领域的未来领导者提供一个全面的教育框架。
1 Introduction
计算毒理学是生命科学中的一个重要领域,它为评估化学品毒性提供了关键支持,涵盖工业化学品、药品、食品和消费品等多个行业。其核心在于利用计算机模型,特别是基于化学结构表示和(定量)结构-活性关系((Q)SAR)的方法,来预测毒理学效应。这种方法不仅提高了毒性评估的效率,还有助于减少对动物试验的依赖。随着监管框架如欧盟REACH法规和美国FDA的预测毒理学路线图的演变,计算毒理学的应用日益广泛,它利用机器学习、化学信息学和系统生物学等工具,在研发管线中早期预测毒理学结果、优先筛选化合物以及满足监管要求方面展现出显著优势。
1.1 Applied use cases in regulatory and product development contexts
计算毒理学的应用已经深入到监管提交、产品开发过程和危害分类框架中。具体用例包括:
1.1.1 Product quality and safety
商业平台(如Leadscope、Derek Nexus)和开源工具(如OECD QSAR工具箱、VEGA)被用于支持监管提交,预测药物杂质、提取物和浸出物(E&L)的细菌致突变性和致癌性。这符合ICH M7等监管框架,该框架推荐使用互补的(统计和专家规则基于的)(Q)SAR模型进行致突变性杂质风险评估。其他相关指南还包括致癌效力计算方法和ISO 10993-1标准在医疗器械中的应用。
1.1.2 Early discovery and candidate screening
在研发管线早期,计算机模型用于识别有毒化合物,降低后期失败风险。毒性基团识别有助于优化化学结构,早期筛查评估支持临床前测试策略的制定。
1.1.3 Non-genotoxic impurities
ICH Q3A和Q3B指南涉及非遗传毒性杂质的鉴定。计算工具和交叉参照方法用于评估非致突变性杂质,EMA的反思文件草案推荐使用(Q)SAR和交叉参照。
1.1.4 Abuse liability
对于具有中枢神经系统(CNS)活性的物质,计算机分析滥用潜力和血脑屏障通透性可以在发现阶段进行早期筛查,补充传统测试方法。
1.1.5 Classification, labelling and packaging
计算机预测为化学品分类和标签提供了一种高效方法,特别是在缺乏生物学数据时。它支持遵守EU REACH和美国TSCA等监管计划,评估的终点包括致突变性、致癌性、皮肤致敏性等。
1.1.6 Occupational risk assessment
通过预测模型、交叉参照和暴露评估,计算毒理学支持职业风险评估,用于确定职业暴露限值(OEB)和选择适当的个人防护装备(PPE)。
1.1.7 Drug–drug interactions (DDI)
FDA关于药物相互作用的指南提供了评估代谢物对细胞色素P450(CYP)酶抑制效应的标准。结构警报和(Q)SAR模型可用于支持可逆和不可逆CYP抑制的评估工作流程。
1.1.8 Food flavourings and pesticide residues
(Q)SAR和交叉参照等方法被用于预测调味品和农药残留的遗传毒性,欧洲食品安全局(EFSA)和美国FDA的食品安全与应用营养中心(CFSAN)都在其安全评估中应用这些方法。
1.1.9 Weight-of-evidence (WoE) assessments
计算毒理学在整合证据权重(WoE)评估中发挥重要作用,特别是对于致癌性、生殖和发育毒性等复杂终点。将计算机预测与实验证据相结合可以增强评估的稳健性。
2 Understanding and teaching computational toxicology
计算毒理学通常包括(Q)SAR和其他建模方法,如生理基于动力学(PBK)建模。以下讨论侧重于(Q)SAR方法的基础概念。
2.1 Chemical structures and descriptors
计算毒理学评估使用化学结构的二维表示,通常是SMILES字符串或结构文件(如SDF或MOL)。从这些输入中,计算出各种描述符(分子性质的定量表示),包括物理化学描述符(如分子量、logP(辛醇-水分配系数)、极性表面积)和结构描述符。化学指纹(如MACCS密钥、ECFP)是分子特征的二进制或哈希表示,用于相似性方法和机器学习模型。更复杂的特征(拓扑、电子、量子力学)也可用于编码结构信息。
2.2 Methodologies in in silico toxicology
2.2.1 Statistical-based models ((Q)SAR)
(Q)SAR模型是关联化学结构与生物活性的数学模型。它们使用描述符在已知活性的训练集上建立数学关系,常见的统计方法包括偏逻辑回归、随机森林、神经网络、支持向量机(SVM)和k-最近邻(k-NN)。模型选择基于数据特征、可解释性需求和用例。
2.2.2 Expert rule-based models
专家规则模型基于条件逻辑规则运行,这些规则编码为结构警报(即与特定毒理学结果相关的化学子结构)。它们具有透明、可解释的优点,但可能在机制未知或化学空间覆盖不足时受限。OECD验证原则(包括明确定义的终点、明确算法、适用域和拟合优度度量)对于监管接受至关重要。
2.2.3 Read-across approaches
交叉参照是一种专家驱动的毒性评估方法,通过从结构相似、毒性已知的源类似物外推数据来预测目标化学品的毒性。关键环节包括识别数据丰富的类似物和评估相似性。计算模型可以支持类似物识别和跨多个领域(如结构、物理化学、代谢和毒理学领域)的相似性评估。当与(Q)SAR、专家规则模型和其他新方法(NAM)结合时,交叉参照评估在监管决策中得到加强。
2.3 Expert review
专家评审是计算毒理学,特别是在监管背景下的一个重要方面。它涉及评估模型输出(如置信度、不同方法间的一致性)、审查基础训练数据、结构类似物、模型适用域,以及评估机制合理性。专家评审考虑了每种方法的局限性,并将计算机、体外和体内数据等多条证据线整合起来,对于得出可靠和科学合理的预测至关重要。
2.4 Building competency in computational toxicology
在计算毒理学领域建立能力需要跨学科培训。用户需要全面理解建模技术和毒理学原理,包括批判性评估基础毒性数据及其如何影响模型输出的能力。了解(监管)应用情境也至关重要。一个全面的教育框架(如图1所示)概述了从基础理解到实际应用的进程,强调了所需的跨学科技能以及这些能力如何通过教育操作化。教育计划应强调方法论(统计基础、专家规则系统、交叉参照)的优势和局限性,而不仅仅是工具功能。随着对非动物毒性评估需求的增长,培养精通新方法(NAM)原则和实践的人才队伍变得尤为重要。
3 Practical implementation of computational toxicology
3.1 Industry expectations and desired skills for computational toxicologists
行业期望计算毒理学家具备毒理学原理知识以及解释计算结果的能力。理解关键毒理学终点(如致突变性、致癌性、生殖发育毒性等)和ADME(吸收、分布、代谢、排泄)对于解释计算输出的生物学相关性至关重要。数据科学能力(如管理、分析、可视化复杂数据集,应用机器学习或人工智能方法)也越来越有价值。了解监管框架、进行模拟监管提交的实践以及科学沟通技巧(清晰解释模型预测及其不确定性)都是重要的技能。可以通过案例研究、实习、跨学科团队项目等方式培养这些能力。
3.2 Collaborative approaches to education and training
计算毒理学领域的市场领导者包括私营和公共公司、公共联盟、政府及学术机构。许多机构通过学术许可、提供培训资源和合作支持课程开发。公共机构和监管机构开发了开放获取工具和数据集(如美国国家毒理学计划的综合化学环境工具和数据集、OECD工具箱)作为宝贵的教育资源。跨行业合作和专业学会(如EU-ToxRisk、ONTOX、HESI)通过奖学金、博士后培训、分享技术等方式支持早期职业科学家。客座讲座和专业研讨会也能提供基础技能曝光。学术和研究机构通过研究不良结局通路(AOP)、开发新方法以及将人工智能融入预测框架来推动该领域发展。可持续的培训途径包括将学术学习与应用经验联系起来的培训管道、奖学金、导师制和实习机会,以及保持教育内容与不断发展的监管和行业需求一致的跨部门对话。
3.3 Regulatory considerations
从业者需要理解计算毒理学方法如何被纳入法规。具有监管接受度的工具必须基于高质量数据,证明其可靠性,并与明确定义的毒理学终点相关联。遵循OECD的(Q)SAR评估框架等最佳实践和验证原则,模型的适用域、算法和验证必须被记录。了解计算方法的全生命周期(从开发到应用)能使个人为不断变化的监管和应用环境做好准备。如图1所示,用例知识是计算毒理学教育的关键组成部分。
3.4 Emerging use of artificial intelligence (AI) tools
计算毒理学的未来受到监管演变和技术进步的影响。传统的AI和机器学习方法长期支持预测毒理学,但将更广泛定义的AI模型整合到预测框架中需要谨慎实施。监管机构倾向于支持透明度(明确定义的终点、可解释性、验证)和整体监管准备度的模型。FDA于2025年1月发布了关于使用AI支持监管决策的草案指南,概述了一个基于风险的可信度框架。尽管AI在药物发现、开发和毒理学研究中的应用潜力和兴趣日益增长,但需要将其与科学和监管原则仔细整合,才能成功融入监管决策框架。本文提出的教育框架,包括基于应用情境(如监管和发现应用)的标准分析、理论理解和实践经验,也适用于AI负责任使用的教育目标。鉴于监管和行业对AI模型透明度和可信度的日益关注,将这些原则融入计算毒理学教育对于培养学员在研究和监管背景下负责任地开发、评估和应用预测模型至关重要。
4 Conclusion
为了充分实现并推动计算毒理学(包括(Q)SAR、专家规则模型、交叉参照方法以及新兴的AI驱动方法)的进步,教育框架必须同步发展。除了熟练使用现有和新兴工具外,评估预测可靠性、解释结果和沟通模型输出的能力也至关重要。这套技能需要跨学科曝光,包括与毒理学、化学、数据科学和法规相关的课程和经验。本文提出的教育框架支持发展推进计算毒理学所需的跨学科能力。为学生和早期职业科学家提供强大的概念基础和真实用例曝光非常有价值。计算毒理学领域依赖于学术界、工业界和监管机构之间的合作。同样,培养能够负责任和有效地推进计算毒理学的人才队伍也需要跨学科教育和实践培训。