编写与阅读:利用合成DNA修饰技术进行纳米孔测序

《ACS Nano》:Write and Read: Harnessing Synthetic DNA Modifications for Nanopore Sequencing

【字体: 时间:2025年11月04日 来源:ACS Nano 16

编辑推荐:

  纳米孔测序通过检测DNA分子通过纳米孔时的电流变化实现基因序列读取,并能够识别甲基化等自然修饰。本研究提出一种“写读”框架,利用化学酶将非天然标签(如葡萄糖或氮唑基团)选择性添加到DNA碱基上,形成独特的电信号特征。通过葡萄糖基化5hmC和烷基化腺嘌呤的实验,证实了合成修饰与天然修饰的电信号差异,且信号变化与DNA序列上下文相关。该方法为多组学整合分析(基因组、表观组、转录组)提供了新途径,但需优化碱基调用模型和适应新一代测序设备。

  纳米孔测序技术因其能够对单个DNA分子进行多组学信息的同步记录而备受关注。这项技术通过监测DNA分子穿过纳米孔时离子电流的变化,可以识别出特定的核苷酸特征。随着研究的深入,科学家们发现天然存在的DNA修饰,如DNA甲基化和羟甲基化,也可以被纳米孔测序技术同时捕捉。此外,通过化学编码的方式,其他如染色质状态或转录因子结合位点等基因组信息也可能被记录下来。本文介绍了一种灵活的“写入-读取”框架,该框架利用非天然合成标签对DNA进行生化酶促标记,从而在纳米孔测序中产生可预测的电学特征。作为一种概念验证,我们探讨了一种DNA葡萄糖化的方法,该方法能够选择性地将5-羟甲基胞嘧啶(5hmC)修饰为葡萄糖或葡萄糖-叠氮化物加合物。我们证明这些修饰可以生成独特且可重复的电流变化,从而实现对化学修饰核苷酸的直接检测。此外,我们还展示了酶促烷基化反应,例如将叠氮基团转移到腺嘌呤的N6位,也能产生与天然腺嘌呤和6-甲基腺嘌呤不同的纳米孔信号变化。这种技术不仅能够直接检测核苷酸,还能够实现生物正交的DNA标记,从而扩展DNA序列中可检测的分子种类。未来,通过可编程的化学修饰技术,对单个分子进行多组学特征的同时分析,将极大地推动遗传学研究和发现。

纳米孔测序作为基因组学领域的一项强大技术,其独特之处在于能够在单分子水平上读取长链核酸分子。蛋白纳米孔作为超高灵敏度的分子传感器,能够检测DNA、RNA或蛋白质等分子穿过纳米孔时对离子电流的影响。当施加电压驱动离子电流通过纳米孔时,分子的通过会减弱电流的流动,从而产生可测量的电流变化。这种变化受到分子大小及其与纳米孔内部相互作用的电荷和疏水效应的影响。这些基本原理构成了纳米孔测序的基础,使得在单分子层面实时分析DNA、RNA或蛋白质成为可能。

蛋白纳米孔的优势之一在于其对核苷酸化学修饰的高度敏感性。这种特性使其在表观遗传学研究中具有重要价值。目前,商用纳米孔测序仪主要训练用于检测天然存在的修饰,如5-甲基胞嘧啶(5mC)和N6-甲基腺嘌呤(6 mA)。然而,通过化学修饰引入的非天然标签可以进一步扩展电学读数的范围,从而为测序提供更丰富的信息。为了实现这一目标,我们探索了一种基于生化酶促标记的“写入-读取”方法,该方法利用非天然分子产生可识别的电流特征。

在DNA葡萄糖化方面,我们采用了一种自然存在的机制,即通过T4 β-葡萄糖转移酶(BGT)将葡萄糖或葡萄糖-叠氮化物供体选择性地转移到5-羟甲基胞嘧啶(5hmC)上,生成5-葡萄糖化羟甲基胞嘧啶(5gmC)或5-叠氮化葡萄糖化羟甲基胞嘧啶(5gmC-N3)。我们证明这些修饰能够产生独特的电流变化,从而与天然存在的胞嘧啶、5mC和5hmC区分开来。此外,我们还探索了腺嘌呤的烷基化反应,使用天然的N6-甲基腺嘌呤(6 mA)和其叠氮化修饰形式(N3-A)进行对比分析。实验结果表明,N3-A在多个序列背景下产生的电流变化更为显著,可能由于其更大的立体体积和不同的分子相互作用。

尽管取得了初步成果,本研究仍存在一些局限性。首先,实验主要基于合成DNA底物,而天然基因组DNA的复杂性尚未完全考虑。其次,化学修饰可能会影响现有测序模型的准确性,导致更多的未匹配事件。因此,需要进一步优化模型以提高对非天然修饰的识别能力。此外,本研究使用了已停产的R9 MinION流细胞,未来的工作将验证该策略在新一代纳米孔测序设备上的兼容性和性能。

随着蛋白质孔工程、电子技术和计算算法的不断进步,我们对天然修饰如DNA甲基化的识别能力也在提升。然而,本文提出的策略为纳米孔测序提供了新的途径,使得在天然核苷酸之外,能够通过选择性的化学修饰实现信号工程。我们的未来工作将专注于创建用于检测合成修饰的训练数据集和稳健的计算模型,从而实现对基因组中不同位置的合成标签的准确识别。这种方法将有助于整合多组学分析,实现对遗传变异、动态表观遗传状态和染色质结构的同步研究,同时利用长读长测序的优势。

在数据处理方面,我们使用了多种工具和方法来分析测序结果。首先,将多读fast5文件转换为单读格式,以便进行后续的信号分析。然后,利用ONT的Guppy软件进行高精度的碱基调用,生成FASTQ文件。为了将碱基调用结果与原始电流数据整合,我们使用了Tombo的annotate_raw_with_fastqs功能,将FASTQ读取与对应的fast5文件关联起来。接下来,我们使用Tombo的resquiggle功能对数据进行标准化处理,通过计算每条读取的中位数(shift)和中位数绝对偏差(scale)来调整信号水平,并将其与参考基因组对齐。最后,我们利用Nanopolish的eventalign功能进一步分析电流变化,提取事件级别的数据,如电流均值、标准差和停留时间,以验证化学修饰的影响。

通过这些方法,我们能够清晰地观察到合成修饰对电流信号的显著影响。特别是在分析未匹配的k-mer事件时,我们发现合成修饰可能导致更多的信号偏差,这表明现有的测序模型尚未完全适应这些非天然标签。尽管如此,这些发现为未来开发更全面的模型和方法提供了重要的基础,同时也为多组学研究开辟了新的方向。通过这种“写入-读取”框架,我们不仅能够识别DNA的化学修饰,还能够扩展测序的分子多样性,从而实现对基因组中多种生物特征的同步分析。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号