综述：推进人类健康风险评估：新方法学（NAM）的作用

《Frontiers in Toxicology》：Advancing human health risk assessment: the role of new approach methodologies

【字体：大中小】 时间：2025年10月08日 来源：Frontiers in Toxicology 4.6

编辑推荐：

　　本综述系统阐述了新方法学（NAM）在填补化学品数据缺口和推动化学风险评估现代化中的关键作用。文章重点介绍了体外（in vitro）、计算机（in silico）模型、组学（OMICS）技术及 Adverse Outcome Pathway（AOP）等前沿方法，探讨了其在减少动物实验、提升危害与暴露评估决策效能方面的潜力，并强调了数据标准化（FAIR原则）、模型自动化（AI/ML）及监管接受度提升的策略。

Highlights

•
体外（in vitro）和计算机（in silico）方法对构建NAM的贡献
•
风险评估中不同方法的自动化
•
数据报告中的当前局限性及改进数据FAIR化的步骤
•
整合高通量方法进行风险评估

1 引言

新方法学（NAM）作为基于3R原则（减少、替代、优化）的替代方法，为最小化动物实验提供了框架，并推动了毒理学风险评估的现代化进程。目前市场上有成千上万种化学品缺乏足够的风险评估数据，传统动物实验成本高昂且存在伦理问题，因此NAM在填补数据空白和加速风险评估方面具有迫切需求。

NAM被定义为新兴技术、方法或方法的组合，有潜力改善风险评估，填补关键信息缺口，并避免或减少对动物研究的依赖。监管机构如USEPA、EFSA、ECHA等正在开发框架以将NAM用于监管应用。集成测试与评估方法（IATA）结合了不同数据源，包括来自NAM的数据，以支持监管决策。

NAM不仅提供风险评估数据，还可用于化学品的优先排序，例如通过点 of departure（PoD）的推导、利用ToxCast和毒理基因组学数据进行生物活性计算，以及丰富不良结局通路（AOP）。计算方法作为NAM的组成部分，能够整合和解释大数据集，提高风险评估的效率和准确性。

本综述概述了全球风险评估者使用的NAM，重点讨论了其局限性、新兴技术（如高通量体外方法、组学分析、物理基础方法和数据驱动方法），以及促进这些方法接受的策略，包括AI/ML在自动化中的作用和数据FAIR化的 harmonization。

2 NAM在化学风险评估中的应用

体外和计算机方法的整合可用于评估风险并确定监管终点。体外方法如3D细胞系、类器官、球状体和微生理系统（MPS）正逐渐被全球研究人员和毒理学家接受。然而，经济合作与发展组织（OECD）关于体外数据生成的框架仍不清晰，限制了其在监管提交中的使用。

计算机方法可分为物理基础的化学信息学方法和数据驱动模型。分子对接等技术可用于预测结合亲和力，帮助优先筛选具有毒性特性的化合物。将化学信息学数据与体外数据或多个计算机模型结合，可为新分子和现有分子构建证据权重。

组学管道与基准剂量建模（BMD）等新方法有潜力揭示常见的生化反应通路并计算IC₅₀等限值。然而，数据标准化、质量和解释仍是监管接受的瓶颈。OECD组学报告框架（OORF）的开发旨在确保数据的可重复性和质量。

生理药代动力学（PBPK）模型目前用于风险转化、暴露重建、化学-化学相互作用等，以预测化学品在生物体内的命运。EFSA使用PBPK模型计算了4种PFAS的可耐受每周摄入量（TWI）。其他计算机工具如QSAR、系统生物学模型等也支持风险评估和NAM方法。

2.1 体外方法学

体外模型领域发展迅速，已成为毒理学和化学评估的关键。这些模型在3R原则实施后越来越受欢迎，因为它们提供了动物实验的可靠替代方案。

2.1.1 从2D到3D细胞培养和类器官

传统体外模型主要依赖2D配置的动物和人类细胞系。这些模型因简单和成本效益而被广泛使用，但无法捕捉人类生理的复杂性。3D培养、干细胞衍生的类器官和微生理系统（MPS）如器官芯片平台更好地模拟了组织架构，允许研究器官特异性毒性、屏障完整性和对化学暴露的多细胞反应。

类器官已被用于研究不同物质（如农药、微塑料、颗粒物）对不同器官的毒性效应。例如，肝脏类器官用于研究代谢介导的肝毒性，大脑类器官用于研究神经发育毒性。尽管类器官在毒性评估中显示出巨大潜力，但其模拟复杂药代动力学过程的能力仍有限。

器官芯片系统等MPS模拟了人类器官的机械和生化环境，允许多器官系统与不同的细胞共培养和3D组织结构连接。这些模型在呼吸系统疾病研究和肾功能研究方面取得了突破。

组织工程等其他新的先进体外方法也显示出在化学风险评估中的潜在应用。尽管这些进展具有高风险潜力，但组织工程系统仍处于开发中，血管化、可扩展性和生物墨水标准化等挑战仍需解决。

尽管有这些进展，由于验证、可重复性和 harmonization 的挑战，这些方法的监管接受度仍然有限。一些OECD指南已经纳入了体外方法，但解决复杂终点如重复剂量毒性、致癌性或生殖毒性仍然是验证和实施体外模型的重大挑战。

2.1.2 用于危害评估的体外数据

全球许多实验室正在开发和优化替代体外测试方法，用于化合物的危害评估。许多开发的体外模型以及高通量技术如成像、高内涵筛选等有潜力降低成本和动物使用，但这些模型和技术的验证复杂且耗时。

例如，OECD指南493是一个特征明确、验证和接受的体外程序，用于识别皮肤刺激物。根据REACH法规1907/2006，这种替代测试可用于皮肤刺激和腐蚀，允许完全替代动物实验。

在发育神经毒性（DNT）方面，Carsten等人的工作评估了92种化学品的57种 assays，包括微电极阵列、网络形成 assay（NFA）和高内涵成像 assay（HCI），发现NFA和HCI有助于评估神经元发育中的关键功能过程。

遗传毒性是另一个体外测试方法先进且被监管机构接受的领域。然而，许多替代体外测试方法由于缺乏验证而未被监管机构完全接受。测试方法验证是指基于科学合理原则的过程，通过该过程确立特定方法的相关性和可靠性。

2.1.3 组学分析

除了证明毒性效应外，体外模型还允许获取机制信息，如分子间的相互作用、细胞代谢的改变或每个器官的特定功能，理解化学物质如何扰动生物通路。这对于建立安全阈值和相关人类PoD至关重要。

通过将这些先进体外系统与其他方法如组学整合，可以将细胞反应与AOP联系起来，并推导定量安全信息，增强其在化学风险评估中的相关性。

组学技术提供了将体外系统转化为化学风险评估强大工具所需的 essential molecular and cellular readings。毒理基因组学方法通过分析化学物质在分子和细胞水平的毒性，有助于表征人类风险，并有可能成为NAM。

转录组学数据可用于识别特定靶标的激活，并基于基因表达的变化计算PoD。代谢组学和蛋白质组学提供对细胞反应的全面理解。单细胞组学技术正在获得关注，以提供对感兴趣组织复杂性的更好 insights。空间转录组学提供了基因表达变化在组织中的空间分布 insights。

当前组学分析的主要挑战是数据分析和整合从多组学技术生成的数据。多组学因子分析（MOFA）和正则化广义典型相关分析（RGCCA）是两种有前途的算法，可用于整合多组学数据集。

OECD提供了OECD组学报告框架（OORF），用于报告基于实验室的毒理学研究中组学数据的监管使用元素，旨在促进数据共享和提高组学毒理学的可重复性。

2.2 计算机方法学

2.2.1 物理基础方法

这些方法常用于药物发现，但在人类健康风险评估的NAM中较少使用。近年来，计算化学方法如分子对接、密度泛函理论（DFT）计算、分子动力学模拟以及使用分子力学泊松-玻尔兹曼表面积（MM/PBSA）和分子力学广义波恩表面积（MM/GBSA）的结合能计算在环境科学期刊中获得了显著关注。

分子对接是一种在计算化学中阐明配体和受体复合物之间相互作用的技术。通过这种技术，可以理解任何化学物质的毒理效应机制。 Ortega-Vallbanaet等人证明，像DockTox这样的工具可以促进针对MIE相关蛋白质的小化合物的虚拟筛选。

分子动力学模拟（MDS）应用牛顿力学来模拟原子随时间的运动和相互作用。通过求解运动方程，MDS能够研究蛋白质灵活性、构象变化和配体结合期间的稳定性。

密度泛函理论（DFT）可用于计算最高占据分子轨道（HOMO）和最低未占分子轨道（LUMO）能量。HOMO-LUMO间隙是确定有毒化学物质稳定性和反应性的重要参数。

这些方法可以作为NAM找到它们的价值，因为它们提供了化学物质与其在人类中的目标受体结合强度的原子级 insights。它们通过揭示关键相互作用，弥合了有害化学物质与其受体之间的差距，促进了具有不同亲和力的有害化学物质的识别，支持风险评估，并有助于通过设计竞争性抑制剂来减轻有害化学物质的影响。

2.2.2 数据驱动方法

计算建模技术如QSAR、read-across、PBPK和IVIVE在毒理学预测和化学安全评估中发挥着关键作用，并可用作REACH法规的动物实验替代方案。

QSAR/QSPR是REACH推荐用于支持物质注册过程的方法之一，其基本将一组描述符（X）与响应（Y）相关联。这些模型可用于预测化合物的物理化学性质以及基于分子结构的生物活性或毒性。然而，为了促进QSAR模型在监管中的考虑，应遵循QSAR建模报告框架（QMRF），以确保模型预测的可重复性和置信度。

Read-across是监管毒理学中广泛应用的重要数据驱动方法， particularly for data-gap filling in chemical risk assessment。它使用来自源（数据丰富）化学物质的信息来预测目标（数据贫乏）化学物质的性质，从而减少实验测试的需求。

对于化学物质的毒代动力学，通用PBPK模型可用于预测化学物质的浓度-时间曲线或毒代动力学。目前，QSAR与PBPK模型相结合有助于生成构建模型所需的参数化数据。

定量IVIVE（QIVIVE）将体外数据与计算机方法（如PBPK建模）结合， together with information on metabolism, transport, and binding to estimate the likelihood of harmful effects from environmental exposures，通过将体外毒性数据转化为体内暴露，帮助化学优先排序，在基于NAM的风险评估中发挥关键作用。

尽管如此，这些计算机模型具有用于不同监管目的的潜在应用，并通过促进风险的有效转化而有可能成为NAM。

2.3 NAMs监管接受的方法

尽管NAM有潜力替代动物实验，但由于缺乏适当的验证、巨大的不确定性或缺乏 harmonization，通常受到风险评估者的 scrutiny。对于体外研究，OECD发布了指导文件（OECD指导文件211），旨在评估大量由替代体外测试产生的数据的相关性，这些数据可能具有实际价值。

根据EFSA，为了增强监管接受，对接结果应在定义的适用性域内解释，与 complementary 计算机方法（QSAR、ML）在证据权重框架下整合，并与机制锚点如MoA或AOP联系起来。使用标准化开源工具（如OECD QSAR Toolbox、VEGA）可以进一步提高透明度和可重复性，从而增强监管信心。

同样，OECD关于PBPK建模的指导文件指导PBPK模型的开发及其验证，以增加其科学有效性。该指导文件的主要目标是提供一个透明和统一的结构用于模型评估，以便于PBPK模型开发者和评估并批准其使用的监管者之间的沟通。

为了进一步简化数据驱动的NAM，OECD开发了其工具箱。QSAR工具箱的主要优势是其能够筛选环境命运终点、急性生态毒性终点以及毒性终点如致突变性、皮肤/眼刺激和致敏性。

3 将体外和计算机方法与AOP结合

AOP代表了从传统毒性测试向更机制化框架的转变，用于建立疾病图谱或转向 adverse outcome。通常，通过告知生物通路的体外测试方法、用于事件量化和预测的计算机模型以及用于数据缺口填充的AI方法 along with other experimental data，可以帮助丰富AOP的信息。

AOP在过去几年中显著增长，许多计算机方法被开发出来，通过考虑真实暴露场景，使其适用于人类风险评估。简而言之，AOP可以帮助解决特定终点，但目前它们更多的是定性而非定量，这限制了它们在监管目的中的使用。

已经有很多关于使用体外和计算机方法量化AOP的工作正在进行中，其中体外 assays 可以提供机制终点数据，而计算机方法如贝叶斯网络、广义线性或回归模型或机制建模可以将数据纳入定量框架以预测 adverse outcome。

NAM的一个成功例子是使用体外转录组学数据计算PFOA的健康 based guidance value。开发了一个以PFOA作为 lead molecule 的计算机工作流程，包括计算a) 显著基因的PoD，b) 计算自由可用的PFOA体外，以及c) 使用QIVIVE估计体内剂量和 later tolerable daily intake。

NAM有潜力改变风险评估，特别是在计算建模和高通量体外数据的改进方面。用于特定终点如皮肤致敏、皮肤和眼刺激、遗传毒性和内分泌活性的NAM足以独立存在，并有潜力告知风险评估。然而，有一些实例 where a battery of NAMs has been used to conclude for the estimation of safety margin for pthalates，突出了在IATA内整合不同NAM的价值。

尽管如此，NAM仍然有一些局限性，特别是在预测系统毒性方面，然而，在不同的项目集群中正在进行的努力，如ASPIS，这是三个欧洲项目的联合合作，用于化学品的无动物安全评估。

4 不同NAM方法的自动化

在过去几年中，机器学习（ML）和人工智能（AI）在通过体外模型、毒理基因组学和计算机建模生成高通量数据方面发挥了重要作用。AI方法在毒性预测作为下一代风险评估（NGRA）的NAM方面越来越受欢迎。

将AI与高通量数据整合有助于识别数千种化学品的生物活性模式，支持化合物优先排序和分组以减少实验。Kim等人使用ToxCast数据库开发了基于机制的毒性预测模型。收集了几乎1,485个生物 assay 数据集，并使用5种ML算法进行模型训练：逻辑回归、决策树、随机森林、梯度提升树和XGBoost，为980个 assays 提供了24,500个模型。选择了311个与急性毒性、致癌性、内分泌干扰以及发育和生殖毒性等终点相关的模型，为使用体外数据进行NGRA的基于AI的模型提供了一个起点。

通过使用大型生物和化学数据库训练ML模型，可以开发新的风险评估方法，预测化学物质之间的分子相互作用以及化学物质如何与不同受体相互作用。正在开发ML模型来预测ADME性质，如caco-2细胞渗透性、血浆未结合分数、清除率，以便 later incorporate in PBK models for predicting toxicokinetic of compounds。

随着计算能力的提高，具有上下文学习能力的大型语言模型（LLMs）正在出现，以改进自动化，并且随着更大的数据集，它们可以被训练和微调，以减少现有和新兴化学品的实验负担。

目前，正在努力实现人类安全评估的不同方法的自动化。KNIME分析平台被用于通过整合PBK、动力学模型和基于虚拟细胞的 assay（VCBA）模型来开发自动化工作流程，以评估化学物质的命运、动力学和毒性。

自动化不仅限于计算模型，而且一些工作正在进行中，用于实验室自动化，即化合物稀释、细胞接种、培养基交换、活力评估等的自动化。实验室自动化已成功用于胚胎干细胞（EST）的常规应用，以96孔格式进行，使得能够并行评估几种化合物。

在欧洲项目如PARC中，也有一些工作正在进行，研究人员正在研究结合不同计算机工具的自动化方法，以开发用于内分泌干扰的IATA。总体而言，通过LLM将这些方法结合在一起并使它们自动化，可能是使用NAM数据实现IATA的一步，然而，仍然存在多个挑战，特别是数据质量和输出参数格式、训练数据的完整性、解决某些LLMs的“黑匣子”性质、管理计算成本以及克服全文处理的 token 限制。

5 Harmonization和数据公平化

Harmonization和数据公平化是重要的支柱，因为实施这些步骤可以导致创建机器可读模型，改进数据报告，从而促进NAM的应用。实验和测量数据是建模、分析、得出结论以及提供建议或指南的必要和 essential resources。

然而，在危害、健康、环境、流行病学或毒理基因组学等领域所需的背景信息通常存在于不同的来源或数据库中，需要它们的整合，这带来了巨大的困难。这些数据库通常在格式上存在异质性，缺乏形式、结构和术语或定义的语义完整性，并且可能以结构化、半结构化或非结构化形式存在。

鉴于基础数据源的变异性，存在显著的需要 harmonization 以获得标准化和质量数据。此步骤中存在的低数据质量、缺乏标准化和异质性等困难意味着需要涉及专家，这些专家必须在不同领域拥有广泛的知识，如数据库编程和操作、数据分析和模型开发与模拟。

在人类健康评估领域，使用NAM生成的数据没有以标准化方式执行或报告。与此相反，动物研究受益于 established guidelines，这些指南简化了这些方面，这是在风险 assessment 中实施替代方法的先决条件。

在数据处理领域，NAM根据其具体应用具有优势和局限性。在异质性方面，基于本体的框架和模式匹配等工具是数据转换和整合的良好选择，因为它们能够标准化和结构化语义，定义术语关系。然而，由于需要手动干预，它在可扩展性方面存在困难。

在这方面，机器学习（ML）或人工智能（AI）等工具通过其自动化能力允许降低手动成本，从而处理可扩展性，并通过过滤、清理和搜索错误、不一致或缺失值的任务提高数据质量，并通过识别模式在 harmonization 中提高数据质量。然而，两者都需要大量真实可靠的数据进行初始学习。

此外，另一个缺点是这些工具会损害数据安全性，因此在健康领域存在显著限制，鉴于这些数据的敏感性和机密性，由主管机构的法规规定，这也影响了它们的存储和使用。

为了处理上述所有方面，有一些研究提出了在语法和语义上标准化的系统，便于其他研究人员使用。其他人则专注于技术框架和平台的开发，例如用于环境传感器数据操作的标准化生态系统，这些系统集成了数据可视化、操作、收集、存储和建模，以网络友好格式进行。

因此，可以看到多种新方法 present advantages and limitations depending on their specific application。一个关键要求是语法、词汇和格式的统一以确保一致性。此外，快速处理大型数据集的能力和保密性对于遵守FAIR（可查找、可访问、可互操作、可重用）原则和使用标准化接口至关重要。

通过GitHub和Open Science Framework等平台进行开放数据共享使研究人员能够更广泛地访问。这在那些高达80%的总时间花费在数据预处理的领域尤其重要。

为了使数据和模型机器可读，可以使用本体，它整合了符号知识表示与文本挖掘技术，以增强从非结构化文本数据中提取和分类信息的能力。与传统文本挖掘主要依赖统计方法不同，它利用预定义本体为解释文本的语义内容提供结构化框架。

目前，有多个与生命科学相关的本体可以帮助提供统一的词汇表并通过嵌入本体构建模型，特别是为机器学习模型学习特征。目前，BioPortal上有超过800个本体来描述生物医学和生物实体。

认识到当前许多NAM（如PBPK建模和AOP）缺乏本体，欧洲化学品风险评估合作伙伴关系（PARC）中的多个合作伙伴正在积极开发解决方案。例如，PARC的工作包7（WP7）内的合作伙伴最近开发了PBPKO（pbpko）。这个新本体和支持工具专门用于注释PBPK模型以增强其FAIR化。

AOP本体最初由Lyle Burgoon在2017年使用，动机是开发人工智能方法，根据高通量 assays 的化学筛选数据预测化学物质的 adverse outcome。该方法利用计算推理器使用一阶逻辑来推断特定化学物质的潜在 adverse outcome。

在PARC倡议的工作包7内，合作伙伴正在与国际专家合作，进一步细化AOP本体。目标是创建一个覆盖整个领域的全面AOP本体，这将显著简化注释过程并提高机器可读性。总体而言，推进领域本体代表了数据 harmonisation 和开发更可重复和稳健预测模型的关键一步。最终，这个 refined biological domain ontology 将在推进支持IATA的NAM中发挥重要作用。

6 结论

总体而言，本文讨论了不同方法，这些方法是或可以成为NAM的一部分。整合多种技术以提取有用信息是IATA和其他风险评估监管框架的目标之一。本文阐述了现有框架中的范围和挑战，以及开发它们所需的复杂性水平，包括提高其监管接受度的策略。

从体内到体外的完全转变仍然不可能，也不打算，因为将不同的输出数据转化为有意义的人类或环境风险评估可能存在挑战。相反，需要多方面整合体外、计算机、基于组学和数据驱动的方法，并在将不同输出转化为有意义的人类和环境风险评估方面存在持续挑战。

对于一些框架转化为NAM，需要数据 harmonisation 和处理步骤。包含本体和训练大型语言模型有助于加速风险评估过程；然而，一个主要瓶颈仍然是执行此任务所需数据的质量和数量。