编辑推荐:
研究人员为解决从 FFPE 组织 DNA 建库难题,开展相关研究,成功建立新方法,助力临床科研。
在生命科学的研究领域中,二代测序(Next-generation sequencing,NGS)技术就像一把神奇的钥匙,能够解锁各种临床样本中蕴含的海量信息,让科研人员从单个样本中探索多个层面的奥秘。想象一下,它能像精密的探测器,同时获取基因组和表观基因组的变化,这在临床诊断和科研探索中有着不可估量的价值。然而,现实却给这把 “钥匙” 设置了重重障碍。
福尔马林固定石蜡包埋(Formalin-fixed paraffin-embedded,FFPE)组织,由于其具备经济高效的长期存储能力,成为了分子分析中主要的生物样本来源之一,尤其是在临床环境中。但它却像是一个暗藏玄机的 “宝箱”,在福尔马林固定过程以及不当存储条件下,其中的 DNA 会遭受各种损伤,如 DNA 片段化、核酸 - 蛋白质交联等,这使得从 FFPE 样本中获取高质量的 NGS 数据变得困难重重。更麻烦的是,DNA 甲基化分析需要对 DNA 进行亚硫酸氢盐处理,将未甲基化的胞嘧啶转化为尿嘧啶,以区分未甲基化和 C5 甲基化的胞嘧啶,可这一过程会进一步加剧 DNA 的降解,无疑是雪上加霜。
为了攻克这些难题,来自韩国全北国立大学药学院、INDNA 公司以及首尔国立大学儿童医院儿科神经外科的研究人员 Eunhye Kim、Sinae An 等人开展了一项极具意义的研究。他们成功建立了一种基于单链 DNA 文库法的高效工作流程,能够从少量受损的 DNA 样本(如 FFPE 组织中的 DNA)中平行构建靶向基因组和表观基因组测序文库。这一成果发表在《Scientific Reports》上,为相关领域的研究带来了新的曙光。
研究人员在此次研究中主要运用了以下几种关键技术方法:首先,他们利用聚焦超声破碎仪将 DNA 剪切成 150 - 250bp 的片段;接着,对于甲基化组文库构建,使用 EZ DNA Methylation-Lightning Kit 进行亚硫酸氢盐转化;之后,借助基于单链的 SRSLY NanoPlus DNA NGS Library Preparation Base kit 将样本变性为单链 DNA,并进行接头连接和索引 PCR;最后,分别采用 Twist Exome 2.0 Panel 和 Twist Human Methylome Panel 进行目标富集,并在 Illumina NovaSeq6000 平台上进行测序。在数据分析阶段,运用多种生物信息学工具对测序数据进行处理和分析。研究使用的样本包括商业购买的参考基因组 DNA 材料,以及 9 例儿童脑癌患者的 gDNA 样本(其中 8 例髓母细胞瘤,1 例继发性胶质母细胞瘤)。
下面让我们来看看具体的研究结果:
- 文库构建流程的建立:研究人员建立了一种快速且简单的平行制备外显子组和甲基化组测序文库的流程。外显子组文库构建起始 DNA 量为 26.7 - 50ng,甲基化组文库为 33.4 - 100ng。整个过程除亚硫酸氢盐转化步骤外基本平行进行,包括 DNA 剪切、亚硫酸氢盐转化(仅甲基化组文库)、变性、接头连接、清洗、PCR 扩增、目标富集等步骤。若采用快速杂交替代过夜杂交,整个流程可在 1 天内完成,且使用统一的方案和试剂构建两种文库,提高了效率和成本效益。
- 外显子组测序性能评估:研究人员对比了当前和以往研究的外显子组测序数据。在 9 例脑癌样本中,当前测序数据的平均目标覆盖度为 36.3 - 66.2x,重复率为 20.2 - 38.2%,脱靶率为 10.3 - 17.3%。与以往研究相比,当前研究虽然覆盖度较低,但覆盖度均匀性更好,80 倍碱基惩罚值更低。通过多种生物信息学工具过滤掉因 DNA 损伤产生的错误单核苷酸变异(Single nucleotide variant,SNV)后,在 FFPE 样本中,当前研究能重现之前双链 DNA 文库产生的 83.0 - 97.0% 的体细胞 SNV(alternate AF>0)。此外,将参考 NA12878 样本的基因型调用结果与两个公共数据集对比,经过过滤后,三个数据集有较高的一致性。
- 甲基化组测序性能评估:所有样本的亚硫酸氢盐转化率均≥99%。在 9 例儿科脑癌样本中,唯一比对读数的比例为 77.2 - 83.5%,重复率为 11.3 - 41.1%,平均脱靶率为 14.1%,80 倍碱基惩罚值平均为 2.02。平均约 322 万个 CpG 位点能达到至少 10x 深度,部分 FFPE 样本中检测到的 CpG 位点数量与参考 gDNA 样本或新鲜冷冻样本相当。将 NA12878 样本的甲基化值与三个公开的全基因组亚硫酸氢盐测序(Whole-genome bisulfite sequencing,WGBS)数据集对比,相关性系数较高,表明该甲基化组测序方法准确性较高。
- 从甲基化组数据中进行 SNV 调用:研究人员基于一种新的生物信息学工具从甲基化组数据中生成 SNV 调用,并与外显子组数据对比。在 9 例临床样本中,甲基化组数据可恢复 39 - 76% 外显子组数据过滤后的 SNV,虽然甲基化组数据存在较多假阳性,但在变异检测方面可对外显子组测序数据起到补充作用。
综合研究结论和讨论部分的内容,这项研究意义重大。研究人员建立的快速高效的外显子组和甲基化组文库平行构建方法,能够在 1.5 天内使用极少量的初始输入 DNA 获得靶向文库,即使是 FFPE 处理、DNA 氧化和 / 或长期存储导致损伤的 DNA 样本也适用。该方法简化了文库构建过程,降低了复杂性和可变性,减少了文库制备时间。同时,在 Illumina 平台上同时测序外显子组和甲基化组文库,外显子组文库能起到校正作用,无需添加额外的 PhiX 进行信号校正,降低了 5 - 20% 的测序成本。从甲基化组数据中还能检测到遗传改变,可对遗传变异进行验证并增加突变检测的覆盖深度,进一步降低了总测序成本。虽然基于单链的文库更容易引入测序错误,但该研究成果仍为后续开发同时检测遗传和表观遗传改变的临床检测面板奠定了基础,有望应用于包括罕见和陈旧临床样本在内的多种 DNA 样本检测,为临床诊断和科研探索提供了有力的支持。