ToxBase:用于高通量人类暴露组(Human Exposome)分析的多维ToxCast参比数据库(Database)

《Environmental Science & Technology》:ToxBase: A Multidimensional ToxCast Reference Database for High-Throughput Human Exposome Analysis

【字体: 时间:2026年06月10日 来源:Environmental Science & Technology 11.3

编辑推荐:

  高分辨质谱(High-resolution mass spectrometry, HRMS)是全面表征复杂人体基质中化学暴露物的金标准技术,使其成为推进人类暴露组研究的有力分析工具。然而,包括来自离子淌度质谱(Ion Mobility-Mass Spectro

  
高分辨质谱(High-resolution mass spectrometry, HRMS)是全面表征复杂人体基质中化学暴露物的金标准技术,使其成为推进人类暴露组研究的有力分析工具。然而,包括来自离子淌度质谱(Ion Mobility-Mass Spectrometry, IM-MS)的碰撞截面(Collision Cross Section, CCS)测量值和MS/MS碎片谱图在内的HRMS参比数据的匮乏,阻碍了跨实验室对化学暴露物结构置信度的注释。因此研究人员开发了ToxBase,一个涵盖超过2000种源自美国环保署(U.S. Environmental Protection Agency, EPA) ToxCast化学品库的多维(m/z、保留时间(Retention Time, RT)、CCS、MS/MS)参比数据库。该数据库通过高通量液相色谱-离子淌度-串联质谱(Liquid Chromatography-Ion Mobility-Tandem Mass Spectrometry, LC-IM-MS/MS)构建,包含涵盖2075种独特化合物的3598个前体离子,具有优异的精密度(98.5%的化合物日间CCS相对标准偏差RSD < 1%)及较强的跨平台一致性。利用靶向数据依赖采集(Data-Dependent Acquisition, DDA)及新型数据提取算法DDARawProcessor,构建了碎片化前体的高质量MS/MS参比谱库。将ToxBase应用于人血浆、尿液和粪便样本的LC-IM-MS/MS数据(n=20每基质)时,快速实现了42个高置信度(Level 1)鉴定。ToxBase数据库免费开放,兼容开源MS数据处理平台Skyline,适用于不依赖仪器厂商的可疑筛查工作流程,为标准化的大规模暴露组分析提供了宝贵资源。
《Environmental Science & Technology》刊载研究:ToxBase多维ToxCast参比数据库用于高通量人类暴露组分析的解读
一、研究背景与立项依据
暴露组(Exposome)指个体一生中所经历的全部非遗传因素集合,其中化学暴露物(源于农药、塑料助剂、药品、日化品及环境污染等)的混合暴露及其交互作用与癌症、代谢性疾病等慢性病密切相关。尽管高分辨质谱(HRMS)已能实现复杂生物基质中化学暴露物的广谱检测,但目前缺乏包含色谱保留时间(RT)、离子淌度碰撞截面(CCS, Collision Cross Section)及MS/MS碎片谱图的多维参比数据库,导致复杂基质中化学物的结构注释置信度低、跨实验室结果难以比对。已有的数据库如T3DB、Exposome-Explorer未整合RT与CCS等关键正交识别参数。美国环保署(EPA) ToxCast库包含约4600种结构多样的环境相关化合物,是理想的覆盖对象。为此,研究人员开展了构建涵盖ToxCast化合物多维(m/z、RT、TWIMCCSN2、MS/MS)参比数据库——ToxBase,并验证其在人体生物样本暴露组可疑筛查(Suspect Screening)中应用价值的研究。
二、主要关键技术方法
研究人员获取并稀释EPA ToxCast标准品(4684种,0.4 mM DMSO储备液稀释至10 μM乙腈),利用全自动移液制备于384孔板。采用Waters Acquity UPLC串联Synapt XS Q-TOF质谱,在电喷雾电离正(ESI+)和负(ESI?)模式下进行高通量UPLC-IM-MS全扫描测定TWIMCCSN2(以聚丙氨酸PolyAla校正),同步用DDA模式采集MS/MS谱图。自行开发Python包toxccs进行.raw文件自动提取EIC/EIM高斯拟合及CCS校准;开发DDARawProcessor模块从DDA文件中提取最优MS2谱。筛选RSD>3%的CCS特征剔除后,合并化合物名称、理论m/z、加合类型、分子式、RT、TWIMCCSN2及MS/MS峰列表汇编为MSP格式库供Skyline调用。收集20名健康成年人(18–49岁,BMI 18–27 kg/m2)血浆、尿液及粪便样本,经含氘代苯扎氯铵(BAC)内标的沉淀/萃取法处理后,UPLC-IM-MSE(HDMSE)全扫描采集,导入Skyline匹配ToxBase进行空白扣除、RT偏差≤0.1 min、漂移时间窗口0.3 ms、同位素分布得分(idotp)≥0.7及点积得分(dotp)≥0.5过滤,按Schymanski标准判定Level 1–3置信度。
三、研究结果
High-Throughput UPLC-IM-MS Analysis(高通量UPLC-IM-MS分析)
通过对ToxCast标准品在ESI+和ESI?模式下三次重复分析,toxccs包处理约28000个.raw文件(>6 TB),最终检测到3598个离子对应2075种独特化合物(占分析标准的44.3%),其中ESI+模式检出2346个阳离子([M+H]+、[M]+、[M+Na]+、[M+K]+、[M+H–H2O]+),ESI?模式检出1252个阴离子([M–H]?、[M+Cl]?、[M+FA–H]?、[M–H–H2O]?)。按ClassyFire分类40.6%为苯系物,其余含有机杂环、脂质及有机酸等16个超类159个类别。未能获得CCS的主要为烯醇脂质及烃类等不适于ESI电离的化合物。
Assembly of the ToxBase MS/MS Reference Library(ToxBase MS/MS参比谱库组建)
为避免DIA(MSE)共流出干扰及靶向MRM低通量弊端,研究人员采用DDA模式获取参考标准MS/MS谱,借助自研DDARawProcessor按前体m/z强度排序提取最理想碎片扫描,最终收录1629种化合物(约占ToxBase条目的79%)的高质量MS/MS谱,构建MSP格式谱库。
IM-MS Conformational Space of ToxCast Compounds(ToxCast化合物的离子淌度-质谱构象空间)
测得TWIMCCSN2与m/z符合幂回归模型(R2=0.87),CCS范围118.39 ?2(三氟甲磺酸[M–H]?)至323.94 ?2(地高辛[M+H]+),m/z范围93.0346–875.4877 Da;98.5%化合物三日间CCS RSD<1%。93.2%数据点落于趋势线±10%带内。含Br/I原子化合物因重卤素增加质量不按比例增大体积而显著低于趋势线并依碘原子数成簇;脂肪酸与甾体/甾衍生物高于趋势线但分布各异。101个化合物出现双峰淌度谱(双TWIMCCSN2),以取代苯系(30%)和甾体(21%)居多,示气相中异构/原形体共存;典型如依托泊苷(etoposide)[M–H]?在LC单峰而IM双峰,后期峰具特有去质子化乙叉葡萄糖醛酸碎片(m/z 204.06),表明C3′/C4′与C4″位去质子化形成不同气相构象。
Comparison to Literature CCS Values(与文献CCS值比对)
与Teri等人报道的DTCCSN2(1592个共有加合物)比较,[M+H]+、[M+Na]+、[M–H]?中位ΔCCS%分别为0.87%、1.26%、0.83%,80%差值<2%,仅4.2%>5%。具双峰淌度的化合物(如坎地沙坦酯)一方与DTCCS吻合另一方差异大(ΔCCS达7.1%),说明气相构象异质性影响跨平台比对。ToxBase新增765种化合物共1376个此前未报道的CCS值,涵盖三氯生、毒死蜱及人群常见紫外线滤料4-羟基二苯甲酮等。
Exposomic Analysis of Human Plasma, Urine, and Fecal Samples(人血浆、尿液及粪便样本的暴露组学分析)
将ToxBase导入Skyline处理20人三基质UPLC-IM-MSE数据,去空白后按多维阈值筛选,共获42种Level 1置信度ToxCast化合物:粪便24种(如季铵盐类 Benzalkonium C14、石胆酸)、尿液18种(如脱乙基莠去津DEA、核黄素)、血浆7种(如脱异丙基莠去津DIA、胡椒碱)。高频检出(>75%)包括8-羟基喹啉(血浆95%、尿95%、粪100%)、核黄素(尿100%、粪85%)、多种季铵盐(粪100%)及莠去津代谢物等。部分芳香胺(1-/2-萘胺、甲基喹啉异构体)满足所有阈值但因异构无法区分归为Level 3。证明多基质联用可互补捕获不同暴露特征(粪便富集日化/微生物转化物,血浆/尿捕获特定代谢物),ToxBase多维过滤显著提升注释置信度。
四、讨论与结论总结(翻译结论要点)
ToxBase提供了逾2000种独特ToxCast化合物的多维(m/z、RT、TWIMCCSN2、MS/MS)参比数据,包含3598个离子的CCS值(其中>1300个为首次报道)及1629种化合物的MS/MS谱,兼容Skyline等开源平台用于跨仪器可疑筛查。CCS日间重现性高(98.5% RSD<1%)且与漂移管离子淌度(DTCCSN2)具良好跨平台一致性(中位ΔCCS<1.3%)。离子淌度引入正交分离可有效解卷积共流出及区分气相构象异质性。应用ToxBase于人血浆、尿液及粪便实现42种环境化合物的Level 1鉴定,揭示多基质暴露组轮廓互补性。局限含ESI对非/弱极性物检测受限、反相色谱RT具方法专属性(文内给出锚定物建议)、部分异构体需更高分辨区隔。未来结合定量流程及IVIVE/PBPK模型可拓展至暴露风险评估。该免费数据库显著推进了HRMS基础暴露组学标准化与注释可靠性。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号