利用机器学习加速的一小时核磁共振(1H NMR)定量技术,用于单克隆抗体生产过程中生物代谢物的监测

《Journal of Pharmaceutical and Biomedical Analysis》:Machine learning-accelerated 1H NMR quantification for bioprocess metabolite monitoring in monoclonal antibody production

【字体: 时间:2025年11月22日 来源:Journal of Pharmaceutical and Biomedical Analysis 3.1

编辑推荐:

  NMR光谱分析机器学习模型在阿达木单抗生物类似药生产中监测代谢动态,比较PLSR、ridge回归和LightGBM三种算法发现后两者在预测准确性和模型可解释性上更优,尤其ridge回归对葡萄糖、乳酸及氨基酸的定量表现突出,模型R2>0.92且RPD>3.6,为智能化生物制造过程监控提供新工具。

  在生物制药领域,单克隆抗体(mAb)药物因其高特异性以及可调节的特性,已经成为癌症免疫治疗和自身免疫性疾病治疗的重要支柱。随着这类药物的广泛应用,其生产过程的监控变得愈发关键,以确保产品质量的一致性和生产效率的提升。其中,adalimumab作为一种重组人IgG1单克隆抗体,其作用机制是通过特异性结合肿瘤坏死因子-α(TNF-α),从而阻止其与细胞膜受体的相互作用,减少炎症反应。由于adalimumab在临床治疗中的显著效果,它已成为全球最成功的生物制剂之一,拥有多家获批的生物类似物,如Amgevita?(Amgen)、Hyrimoz?(Sandoz)和Abrilada?(Pfizer)。在激烈的市场竞争下,制造工艺的高效性和一致性成为保障产品质量的关键因素。

在细胞培养过程中,细微的条件变化,尤其是营养物质的利用和代谢物的积累,会对后期翻译修饰,如糖基化和聚集等关键质量属性(CQAs)产生影响,这些修饰直接关系到药物的疗效和稳定性。因此,对代谢物动态变化的实时监测成为确保细胞培养过程一致性的核心环节。本研究以adalimumab生物类似物的生产过程为模型,建立了一种基于机器学习的快速、智能化的1H NMR过程监测框架,以期为生物制药制造提供新的技术支持。

1H NMR技术因其非破坏性、固有定量性和同时检测多种成分的能力,成为生物过程代谢监测的强大工具。在用于单克隆抗体生产的中国仓鼠卵巢(CHO)细胞培养过程中,1H NMR已被用于跟踪代谢物浓度的变化,从而实现过程的监控和优化。然而,目前的生物过程应用仍面临两大瓶颈。首先,生物反应器样品的复杂性导致严重的峰重叠,这种现象在单克隆抗体培养介质中尤为明显,其中超过40种代谢物的信号在有限的化学位移范围内产生多维干扰。尽管已有多种谱图解卷积技术,如多变量曲线解析-交替最小二乘法(MCR-ALS)等,可以部分解决峰重叠问题以实现准确的定量分析,但这些方法通常需要严格的峰对齐和大量的先验知识,限制了其在高通量场景中的应用。其次,生物样品的准确定量通常依赖于经过培训的专家进行手动或半自动的1H NMR分析,这不仅耗时,而且难以满足大规模应用的需求。虽然已有多种自动化分析方法被开发,但多数适用于临床生物流体(如血液),在细胞培养过程中代谢物组成动态变化的情况下,如新代谢物的出现或因pH波动和离子强度变化导致的化学位移漂移,这些方法表现不佳。这种低效的分析过程与生物反应器培养过程(通常持续1-2周)所需的实时优化要求形成鲜明对比,极大地限制了NMR技术在工业过程分析技术(PAT)框架下的大规模应用。

近年来,机器学习技术的突破为解决上述瓶颈提供了新的可能。与传统的解卷积方法不同,机器学习模型可以直接基于高维的1H NMR谱图数据进行训练,从而学习识别与特定代谢物相关的复杂、多变量模式,即使在严重的峰重叠区域也能实现有效的识别和定量。例如,正则化线性模型如岭回归(Ridge Regression)能够构建系数图,将权重分布到相关的谱图变量上,提高在高维数据中的稳定性。同时,基于树的集成方法如Light Gradient Boosting Machine(LightGBM)在捕捉谱图特征与代谢物浓度之间的非线性关系方面表现出色,使得在无需明确峰识别或解卷积的情况下,实现有效的浓度预测成为可能。这种能力使得机器学习能够在原始谱图数据上实现快速、直接的浓度估计,从而有效绕过传统分析方法的一大瓶颈。

基于机器学习的快速1H NMR定量分析显著减少了人工干预的需求,使其特别适用于细胞培养过程中代谢物组成动态变化的场景。尽管机器学习在复杂混合物(如血清、中药注射剂、食品基质)的定量NMR分析方面已取得进展,但其在单克隆抗体生产过程中代谢物监测的应用仍处于初步探索阶段。代谢物监测在确保细胞培养过程一致性的过程中起着关键作用,因此,开发快速、准确的1H NMR定量方法对于抗体生产具有重要意义。

本研究旨在系统评估三种广泛使用的机器学习算法——偏最小二乘回归(PLSR)、岭回归和LightGBM在对20种关键代谢物进行定量预测方面的性能差异。PLSR作为一种常用的谱图分析方法,虽然在某些情况下表现良好,但在处理复杂数据集中的多重共线性时可能存在局限。相比之下,岭回归通过其正则化能力,能够更好地应对高维数据中的相关性问题。而LightGBM作为一种基于树的模型,在处理谱图特征与代谢物浓度之间的复杂、非线性关系方面具有显著优势。通过比较这三种算法的预测性能,本研究希望找到一种在生物过程监测中效率和准确性都较高的模型,为推动NMR技术在生物制药制造中的工业应用提供理论支持和技术基础。

在本研究中,我们收集了2022年至2023年间58个商业生产批次的细胞培养上清液样本,共计729个样本。这些上清液由BioRay Pharmaceutical Co., Ltd.(中国台州)提供,来源于用于生产adalimumab生物类似物的12天补料分批培养的重组CHO-S细胞。每个批次每天采集一个样本,并对每个样本进行一次1H NMR谱图采集,最终得到729个完整的谱图数据。这些数据用于训练和验证机器学习模型,以实现对关键代谢物的快速定量分析。在细胞培养过程中,代谢物的组成随时间变化而变化,尤其是在不同培养阶段,代谢物的浓度呈现出显著的波动。此外,由于培养过程中pH值和离子强度的变化,某些代谢物(特别是氨基酸)的化学位移会发生明显偏移,进一步增加了代谢物识别和定量的难度。

为了实现对这些复杂代谢物的准确监测,本研究构建了基于机器学习的1H NMR分析模型。通过对比PLSR、岭回归和LightGBM三种模型的预测性能,我们发现尽管这三种模型都能实现对关键代谢物的准确预测,但岭回归和LightGBM在预测精度和模型可解释性方面展现出明显优势。这一差异可能源于它们在处理高维数据和复杂非线性关系时的不同机制。岭回归通过正则化技术有效控制模型复杂度,提高了预测的稳定性,特别是在处理与关键代谢物(如葡萄糖、乳酸和大多数氨基酸)相关的谱图数据时表现出色。而LightGBM则通过其强大的非线性建模能力,在处理某些代谢物的复杂变化时表现出更高的准确性。

研究结果表明,所构建的最优模型在预测性能方面表现出色,其回归系数(R2)均超过0.92,残差预测偏差(RPD)值均高于3.6。这表明模型在预测关键代谢物浓度方面具有高度的可靠性和准确性,为实现单克隆抗体生产过程的智能化监控提供了有力支持。通过这种智能化的监测手段,可以有效确保生物过程的一致性,提高产量和产品质量,从而最终降低培养成本。本研究不仅为单克隆抗体生产过程的监测提供了新的工具,也为生物制药制造中的过程分析技术(PAT)框架提供了理论支持和技术基础。

此外,本研究还探讨了1H NMR在生物过程监测中的应用前景。随着机器学习技术的不断发展,其在处理高维、复杂数据方面的潜力将进一步释放。这不仅有助于提高代谢物监测的效率和准确性,还可能推动NMR技术在生物制药制造中的更广泛应用。通过建立基于机器学习的1H NMR分析模型,可以实现对代谢物动态变化的实时跟踪,为优化生产过程、提高产品质量提供数据支持。同时,这种模型的应用还可以减少对专家知识的依赖,提高分析过程的自动化程度,从而满足大规模工业应用的需求。

在实际应用中,机器学习模型的构建和优化需要考虑多个因素,包括数据的预处理、特征选择、模型训练和验证等。通过对729个1H NMR谱图数据的系统分析,我们发现不同代谢物的浓度变化模式存在显著差异,这要求模型在处理不同代谢物时具有相应的适应能力。同时,由于不同批次的细胞培养条件可能存在微小差异,模型需要具备一定的鲁棒性,以确保在不同条件下仍能保持较高的预测精度。此外,模型的可解释性也是重要的考量因素,特别是在生物制药制造过程中,需要对模型的预测结果进行深入分析,以确保其在实际应用中的可靠性。

本研究的成果不仅为单克隆抗体生产过程的监测提供了新的方法,也为其他生物制药过程的监测提供了借鉴。随着生物制药技术的不断发展,对代谢物监测的需求将不断增加,因此,开发高效、准确的1H NMR定量方法将成为未来研究的重要方向。同时,随着人工智能技术的不断进步,机器学习在生物制药制造中的应用也将更加广泛,为实现智能化、自动化的过程监控提供新的技术支持。

综上所述,本研究通过引入机器学习算法,实现了对1H NMR谱图数据的高效处理,为单克隆抗体生产过程的监控提供了新的工具。通过对PLSR、岭回归和LightGBM三种算法的比较,我们发现岭回归在关键代谢物的定量分析中表现出显著优势,而LightGBM在某些代谢物的预测精度方面略胜一筹。这表明,针对不同的代谢物和不同的应用场景,选择合适的机器学习算法是实现高效、准确代谢物监测的关键。同时,本研究还为未来的生物制药过程分析提供了理论支持和技术基础,为推动NMR技术在工业制造中的应用开辟了新的道路。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号