通过生成模型提取聚山梨酯20和80的特征指纹

《International Journal of Pharmaceutics: X》:Extraction of the polysorbate 20 and 80 fingerprint via generative modeling

【字体: 时间:2025年11月10日 来源:International Journal of Pharmaceutics: X 5.2

编辑推荐:

  分层生成模型用于自动解析多糖泡(PS20和PS80)的LC-MS数据,通过整合结构域知识实现分子级组成和降解路径分析,显著提升生物制药中多糖泡的质量控制效率。

  在现代生物制药领域,多糖类表面活性剂(如聚山梨酯20和80)在产品稳定性方面发挥着至关重要的作用。然而,这些物质的高度异质性和对氧化及酶促水解的易感性,给常规分析带来了诸多挑战。为此,研究团队开发了一种分层生成模型,能够重建完整的液相色谱-质谱(LC-MS)数据,从而自动解析复杂的聚山梨酯数据集。这一模型不仅能够识别个体亚种,还能在分子层面上提供成分分析,特别适用于质量控制、批次选择以及产品开发和制造过程中的降解监测。

### 1. 研究背景与意义

近年来,人工智能(AI)技术的迅速发展对多个行业产生了深远影响,其中制药领域尤为显著。AI辅助分析为药物开发提供了提升效率和精度的全新可能性。生成模型作为AI的一个分支,正在改变药物研发的方式。这些模型可以设计出具有特定性能的新分子,从而加快研究进程。同时,AI在分析流程中的自动化应用,使得处理大量样本或复杂数据结构成为可能。在分析化学领域,生成模型被证明是一种强大的技术,能够对复杂数据集进行深入分析。

聚山梨酯(PS)20和80是目前生物稳定剂中最广泛使用的表面活性剂,其组成包括超过600种不同的物质,这种高度异质性使得它们成为生成模型的理想候选对象。在LC-MS分析过程中,PS会生成大量数据,因此,这种新型方法为提取有关聚山梨酯组成和降解模式的详细信息提供了全面的解决方案。

与传统分析方法不同,生成模型能够通过优化底层参数,重现整个LC-MS数据集。这种方法同时考虑了数据的各个方面,从而实现更稳健的分析。通过结合领域知识,如聚山梨酯的基本结构、聚氧乙烯(POE)链长度、脂肪酸酯化和同位素模式,模型能够生成与实验观察高度一致的合成LC-MS数据。这种能力使得研究者可以更深入地探索聚山梨酯的化学特性,并识别降解路径。

### 2. 研究方法

#### 2.1 材料

研究中使用了不同等级和制造商的聚山梨酯20和80样品,包括高纯度(HP)和超精细(SR)以及中国等级(CG)。此外,还使用了乙腈、甲醇、甲酸铵等溶剂和试剂,以及单克隆抗体1(mAb1)作为测试样本。所有实验均在严格的条件下进行,以确保数据的准确性和可重复性。

#### 2.2 方法

为了评估不同PS等级和制造商的样品,研究团队首先将PS20和PS80样品分别稀释至0.3 mg/mL和0.25 mg/mL。随后,对PS20 HP和PS80 HP进行了强制氧化降解研究,将样品置于40°C/75%相对湿度下储存长达18周,并根据完整PS的剩余比例分为四个降解等级。对于酶促水解降解研究,使用了含有水解活性的IgG1抗体,并将其与PS20 HP结合,以模拟实际降解情况。

实验采用的RP-UPLC-MS方法借鉴了先前的研究,使用Waters Oasis?Max混合模式柱和Poroshell 120 SB-C08反相柱进行分离。流动相由乙腈、超纯水和甲醇组成,流速为0.7 mL/min。通过这种方法,研究团队能够有效分离PS的各个亚种,并分析其降解过程。

### 3. 分层生成模型的构建

#### 3.1 全局参数

在模型的最顶层,全局参数用于描述LC-MS系统的基本特征和测量过程。其中,一个关键概念是“OE-Elution Velocity”,即随着OE单位数量的增加,保留时间的变化趋势。模型引入这一参数,以更精确地捕捉OE单位对保留时间的影响。通过分析实验数据,研究团队发现,随着OE单位的增加,保留时间呈现出近似线性变化,这一趋势在实验数据中表现为时间-质荷比(m/z)轮廓图中的“斜率”。

此外,模型还引入了“OE-Elution Acceleration”和“OE-Elution Intercept”等参数,以描述OE-Elution Velocity随时间的变化率和初始值。对于不含有脂肪酸链的分子,模型还引入了“OE-Elution Velocity for molecules without fatty acids”这一固定参数,以处理特殊情况。

#### 3.2 LC聚合物组参数

在第二层,模型考虑了聚合物组(polymer group)的特性。每个聚合物组由相同化学结构但不同OE数量的分子组成。模型通过两个类型的参数(拟合参数和导出参数)来描述每个聚合物组的保留行为。拟合参数用于直接优化模型,而导出参数则由拟合参数计算得出。例如,拟合参数包括聚合物组h的保留时间位置(t_loc^h)和保留时间分布(σ_spread^h),这些参数共同决定了该聚合物组的保留行为。

#### 3.3 LC“Panini”参数

在第三层,模型引入了“Panini”这一术语,用于描述特定分子组(聚合物组)与特定铵加合物电荷状态的组合。每个“Panini”在LC-MS轮廓图中呈现出独特的信号,这些信号通常具有倾斜的双峰分布,类似于煎饼的纹理。通过分析这些分布,模型能够识别不同分子的OE分布,并区分降解和未降解状态。

#### 3.4 LC离子化分子参数

在第四层,模型考虑了每个离子化分子的特性。每个分子在LC-MS数据中的出现,由三个关键参数决定:保留时间、保留时间分布和强度。这些参数由“Panini”层和聚合物组的特性推导而来,共同决定了分子在LC-MS数据中的表现。

#### 3.5 质谱生成

在第五层,模型生成最终的LC-MS强度数据。这一过程考虑了分子的质荷比(m/z)分布和同位素特性。通过引入“Isotope peak smoothing parameter”这一全局参数,模型能够更精确地模拟同位素峰的宽度,从而生成更符合实验观测的强度矩阵。

### 4. 研究结果与讨论

#### 4.1 聚山梨酯亚种的特征分析

研究团队首先评估了生成模型与手动积分的比较结果。通过计算总峰面积和降解部分的相对百分比,发现模型与手动积分的匹配度较高,分别为79.7%和81.9%。此外,模型能够准确识别不同PS亚种的分布情况,例如POE12、POE14和POE16等,这些分子在不同氧化等级下的表现差异显著。例如,在氧化等级2和3时,POE14和POE16的降解率高于POE12,这表明较高阶的酯化分子更容易发生降解。

#### 4.2 聚山梨酯批次异质性与质量差异分析

通过分析不同质量等级(HP、SR和CG)的PS20和PS80,研究团队发现,SR和CG批次中,聚山梨酯的含量高于HP批次。此外,CG批次几乎不含POE分子,这可能与其制造工艺或额外纯化步骤有关。这一发现对质量控制具有重要意义,因为不同批次的PS可能对产品稳定性产生不同影响。

#### 4.3 聚山梨酯降解机制分析

在氧化降解方面,研究团队发现PS20和PS80的降解过程存在显著差异。PS20的氧化路径相对简单,只需要两个步骤即可形成过氧化物(POE-peroxide),而PS80则需要三个步骤。这种差异使得PS20在中等氧化等级下形成过氧化物的速度更快。此外,PS80的氧化产物,如POE18:1羟基,表现出更复杂的分布模式,这可能与其脂肪酸的不饱和性有关。

在酶促水解方面,研究团队通过模拟实验验证了模型对降解路径的区分能力。在含有mAb1的样品中,未观察到短链POE12酯的增加,反而发现OE单位分布的均匀下降。这表明mAb1可能抑制了PS20的氧化降解,但增加了其自身氧化的可能性。相比之下,不含mAb1的对照样品则表现出明显的氧化降解特征。

### 5. 结论与展望

本研究开发的分层生成模型为聚山梨酯的分析提供了一种全新的方法。该模型不仅能够准确提取分子级别的指纹信息,还能区分不同亚种,避免了传统方法中由于共洗脱而导致的误判问题。此外,模型在不同供应商和批次的PS分析中表现出色,能够快速评估PS质量,并识别可能影响颗粒形成的长链脂肪酸(FA)。

通过分析分子级别的降解模式,模型能够有效区分氧化和酶促水解两种降解路径。这一能力对于药物研发和制造过程中的质量控制至关重要。未来的研究将进一步探索该模型在不同降解路径下的应用,并结合更多降解标志物,以实现更全面的分析。

综上所述,本研究的分层生成模型为聚山梨酯的分析提供了一种高效、全面且自动化的解决方案。该模型不仅提升了分析的精度和深度,还为质量控制、降解监测和药物研发提供了新的工具。随着AI技术的不断进步,这类模型有望在生物制药领域发挥更大的作用,为药物质量的保障和优化提供支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号