RNA-Seq技术替代NanoString nCounter平台在GARDskin皮肤致敏性评估中的应用与验证

《Toxics》:RNA-Seq Can Be Used to Quantify Gene Expression Levels for Use in the GARDskin Assay

【字体: 时间:2025年12月24日 来源:Toxics 4.1

编辑推荐:

  本研究验证了RNA-Seq(RNA测序)技术作为GARDskin(基因组过敏原快速检测)皮肤致敏性评估中基因表达量化的替代方法。通过比对NanoString nCounter平台数据,证实RNA-Seq数据高度相似(Spearman相关系数0.95),并能通过现有分析流程(SVM)实现100%准确分类,为该方法在监管环境下的应用提供了有力证据。

  
研究背景与目的
过敏性接触性皮炎(Allergic Contact Dermatitis, ACD)是一种由小分子化学物质引发的免疫反应,其发生机制相对明确,这促进了多种皮肤致敏物识别和表征方法的发展。随着非动物方法(Non-animal Methods, NAMs)的不断演进,GARDskin(Genomic Allergen Rapid Detection)检测方法作为一种科学和监管认可的方法,被用于评估皮肤致敏物。该方法基于人源树突状细胞样细胞系,通过测量基因表达变化来预测致敏性。
目前,GARDskin检测依赖于NanoString nCounter平台进行靶向基因表达测量。尽管该平台具有操作简单、通量高、数据易于处理等优点,但探索其他兼容的基因表达量化平台,如下一代测序(Next Generation Sequencing, NGS)技术中的RNA-Seq(RNA测序),具有重要价值。RNA-Seq技术用户基础广泛,且能提供全转录组数据,为二次分析提供了更多可能性。
本研究的主要目的是评估RNA-Seq技术是否可以作为GARDskin检测中基因表达数据的量化方法,并验证其能否在现有的GARDskin分析流程中产生准确的致敏性分类。
材料与方法
研究设计与样本
研究设计分为两个主要部分。第一部分旨在比较两个平台之间的基因表达数据,共收集了24对配对RNA样本,分别对应12个GARDskin未刺激对照和12个GARDskin阳性对照(对苯二胺,PPD)。这些样本用于直接比较平台间的差异,并优化RNA-Seq平台上NanoString探针信号的重建。
第二部分旨在评估RNA-Seq数据的预测能力,包含了另外75个仅通过RNA-Seq平台获取的RNA样本,对应22种不同的化学物质处理以及GARDskin阳性和未刺激对照。为了加强研究的完整性,RNA-Seq分析由独立的合同研究组织(Contract Research Organization, CRO)进行,样本身份被编码,测序实验在不知晓样本身份的情况下完成。
RNA-Seq数据处理与信号重建
测序数据经过质量控制、接头序列和低质量碱基修剪后,使用salmon软件进行转录本定量。为了将RNA-Seq数据与现有的GARDskin模型兼容,研究团队通过序列比对将NanoString探针的靶序列映射到参考转录组上,以识别用于信号重建的候选转录本。
随后,利用24对配对样本,采用反向消除程序(backward elimination procedure)对候选转录本集进行优化,以最大化RNA-Seq数据与NanoString nCounter数据之间的相似性。最终,使用872个转录本重建了196个NanoString探针信号。
数据分析与分类
平台间的表达水平比较基于配对样本,计算了Spearman相关系数和Lin's一致性相关系数(Lin's concordance correlation coefficient)。GARDskin预测通过将重建的信号输入标准的GARDskin分析流程获得,该流程包括基于总计数(counts per total counts, CPTC)的标准化、BARA标准化(用于减少批次效应)以及使用已训练的支持向量机(Support Vector Machine, SVM)进行分类。
此外,研究还评估了测序深度对GARDskin分类的影响,通过二项式重采样(binomial subsampling)和从fastq文件进行重采样两种方法,分析了不同测序深度下的分类性能。
结果
平台间基因表达谱的比较
通过比较24对配对样本,研究发现两个平台产生的基因表达谱高度相似。对于阳性对照(PPD)处理诱导的相对效应估计,Spearman相关系数高达0.95,Lin's一致性相关系数为0.87,表明两个平台在检测基因表达变化方面具有高度一致性。
然而,也观察到少数基因在两个平台间存在显著差异。在表达水平比较中,差异较大的基因包括SNORA45、五个组蛋白簇基因(HIST1H1C, HIST1H1E, HIST1H3G, HIST1H3J, HIST2H2AA3)和UFC1。在效应估计比较中,差异较大的基因包括五个组蛋白簇基因(HIST1H1C, HIST1H1E, HIST1H3J, HIST2H2AA3, HIST2H2BF)和ACER2。这些差异可能与RNA-Seq文库构建方法(如poly-A富集)对某些特定RNA类型的捕获效率有关。
基于RNA-Seq数据的致敏性分类
将75个样本的重建信号输入标准的GARDskin分析流程后,所有化学物质均被正确分类。准确度、灵敏度和特异性均达到100%。预测的决策值(decision values)与标准检测中观察到的结果非常相似,且重复样本间的标准偏差为0.64,符合预期。
测序深度评估
通过重采样分析发现,GARDskin分类的准确性在测序深度较低时(≤100万条reads)开始明显下降。研究得出结论,平均每个样本500万至1000万条reads足以维持稳定的分类性能。在500万和1000万reads的测序深度下,重采样数据的均方根误差(Root Mean Squared Error, RMSE)和交叉熵(cross-entropy)均表明分类性能与完整数据集非常接近。
讨论与结论
本研究探索了使用RNA-Seq技术作为GARDskin皮肤致敏性评估中基因表达量化替代方法的可能性。结果表明,RNA-Seq平台与NanoString nCounter平台产生的数据高度相似,尤其是在检测基因表达变化方面。尽管少数基因存在差异,但这些差异并未影响最终的致敏性分类。
将RNA-Seq数据输入现有的、经过验证的GARDskin分析流程,能够产生与标准检测完全一致的准确分类结果。此外,研究还确定了维持稳定分类性能所需的测序深度。
综上所述,RNA-Seq可以作为GARDskin检测中基因表达量化的有效方法,用于获得可靠的致敏性分类。在遵循相关批准程序的前提下,这两种获取平台在监管背景下可被视为可互换的。未来的研究重点可放在RNA-Seq平台协议的标准化和质量标准的定义上,以促进其在GARDskin检测中的更广泛应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号