
-
生物通官微
陪你抓住生命科技
跳动的脉搏
牛津纳米孔测序文库制备中的酶促偏好性及其对微生物组和基因组分析的影响研究
【字体: 大 中 小 】 时间:2025年05月20日 来源:BMC Genomics 3.5
编辑推荐:
为解决牛津纳米孔测序(ONT)中因文库制备方法导致的系统性偏差问题,研究人员通过比较连接酶(SQK-LSK109)和转座酶(SQK-RBK110.96)两种文库制备技术的识别基序、GC偏好性及微生物组分析差异,发现转座酶存在5'-TATGA-3'基序偏好性且覆盖度不均,而连接酶法在分类效率和甲基化分析中表现更优。该研究为牛相关微生物组定量研究提供了方法学依据,发表于《BMC Genomics》。
研究背景与意义
长读长测序技术如牛津纳米孔测序(ONT)正逐步改变基因组学研究格局,但其文库制备过程中的酶促反应可能引入难以察觉的偏差。连接酶法和转座酶法是ONT的两种主流文库制备方法,前者依赖T4 DNA连接酶和Taq聚合酶,后者利用MuA转座酶进行片段化与接头连接。已有研究表明,短读长测序中PCR扩增和转座酶(如Tn5)会导致GC含量区域的覆盖偏差,但ONT长读长技术是否受类似影响尚不明确。这一问题对微生物组定量分析、甲基化检测等应用至关重要——若文库制备方法系统性低估特定基因组区域或微生物类群,可能误导甲烷排放预测或表观遗传研究结论。
为探究这一关键问题,由澳大利亚昆士兰大学Elizabeth M. Ross团队牵头,联合西班牙农业食品研究所等机构,通过牛耳组织DNA和瘤胃微生物组样本,系统评估了两种ONT文库制备方法的酶切基序偏好性、GC偏差及其对下游分析的影响。
关键技术方法
研究采用对照实验设计:(1)使用牛参考基因组ARS-UCDv1.2分析转座酶与连接酶的识别基序;(2)通过10 kb窗口计算GC含量与覆盖度的相关性;(3)比较三种DNA提取方法(PowerFecal Pro、DNeasy Plant Mini、Puregene)和两种测序方案对瘤胃微生物α/β多样性和相对丰度的影响;(4)构建含不同GC比例(34.5%-64%)的模拟群落验证定量偏差;(5)利用mCaller分析细菌DNA中N6-甲基腺苷(6mA)的检测差异。所有数据均通过Guppy v6.5.7进行FAST/HAC/SUP三种模式碱基识别。
主要研究结果
1. 酶-DNA相互作用基序的鉴定
通过31 bp窗口的基序分析发现,转座酶法在牛基因组中显著偏好5'-TATGA-3'基序(与MuA已知特性一致),而连接酶法在序列末端呈现AT低表达现象(27.31±1.71% A vs 背景29.00%)。1001 bp窗口分析进一步证实连接酶法在GC含量60-80%区域有更高相互作用频率(0.07±0.07)。
2. GC偏好性对覆盖度的影响
转座酶法在30-40% GC区域呈现峰值覆盖(0.21±0.10),但在40-70% GC区域产量显著降低(最低-0.21±0.07),其覆盖度与相互作用频率强相关(R=0.82)。连接酶法虽存在波动,但整体分布更均衡(R=0.5),尤其在25-30% GC区域接近背景频率。
3. 微生物组分析性能差异
SUP模式碱基识别使分类效率提升5.50-7.48%。连接酶法因读长更长(N50达7469±754 bp vs 转座酶法4856±111 bp),在西班牙样本中分类比例显著提高(52.67±9.84% vs 32.13±6.60%)。值得注意的是,转座酶法高估甲烷菌Methanobrevibacter丰度(87.40±0.58% vs 连接酶法77.11±1.60%),而低估高GC菌Xanthomonas(5.05±2.76% vs 14.07±3.63%)。
4. 模拟群落的定量偏差
即使控制DNA输入比例,两种方法均未能准确反映预期丰度:转座酶法低估低GC菌L. acidophilus(-8.01±4.82%),连接酶法则低估高GC菌B. gallinarum(-16.24±2.17%)。读长N50与偏差呈负相关(R=-0.76),暗示酶对短片段偏好可能干扰定量。
5. 甲基化检测差异
连接酶法检测到更多6mA位点(12.28±3.42% vs 8.08±0.54%),但两种方法共享位点显著高于随机预期(P<0.001),表明覆盖度差异是主要影响因素。
结论与讨论
该研究首次揭示ONT转座酶法的5'-TATGA-3'基序偏好会导致GC相关覆盖偏差,进而扭曲微生物组组成(如高估产甲烷菌)和甲基化检测灵敏度。尽管连接酶法在分类效率和读长上占优,其末端AT低表达问题仍需警惕。研究强调在牛瘤胃微生物组等定量研究中需固定文库制备方法,并为ONT数据标准化提供参考。未来需拓展至土壤、人体样本等验证普适性,同时探索酶工程改造(如固定化Taq聚合酶)以进一步降低偏差。
发表于《BMC Genomics》的这项工作,通过多维度实验设计将技术偏差量化,为长读长测序在精准微生物组学中的应用树立了方法学标杆。
生物通微信公众号
知名企业招聘