编辑推荐:
为明确转基因植物分子特征以获监管审批,研究人员采用双末端全基因组测序(PE-WGS)对转基因大豆 FG72 展开研究,发现 T-DNA 插入位点、拷贝数等,还鉴定出基因组结构变异(SVs),为其商业化提供支撑,凸显 PE-WGS 优势。
在转基因作物的研发与商业化进程中,如何精准刻画其分子特征、评估潜在风险始终是科学界和监管界关注的核心议题。传统的分子表征技术如 Southern blotting、聚合酶链式反应(PCR)和 Sanger 测序等,虽在转基因作物检测中发挥过重要作用,但存在分辨率低、通量不足以及难以全面揭示复杂遗传修饰等局限性。随着转基因技术的发展,尤其是像生物射弹转化这类可能导致复杂基因插入的技术应用,传统方法愈发难以满足对转基因作物进行全面安全评估的需求。在此背景下,新一代测序(NGS)技术的兴起为解决这些难题带来了曙光,其高分辨率和全面性的特点有望更精准地解析转基因作物的分子架构。
为深入探究转基因作物分子特征评估的难题,中国相关研究机构的研究人员开展了针对转基因大豆事件 FG72 的全基因组水平分子表征研究。该研究成果发表在《Food Chemistry: Molecular Sciences》,旨在通过先进的测序技术和生物信息学分析,全面揭示 FG72 中转移 DNA(T-DNA)的整合模式、拷贝数、潜在的质粒骨架残留以及基因组结构变异(SVs),为其商业审批和安全性评价提供更详实的科学依据。
研究人员主要运用了以下关键技术方法:首先是双末端全基因组测序(PE-WGS),通过提取 FG72 及其受体品系 Jack 的基因组 DNA,构建 PE-WGS 文库并进行高通量测序,获得高覆盖度的测序数据;其次是生物信息学分析,利用 BWA-mem 算法将测序 reads 比对到大豆参考基因组和质粒序列,通过定制 Python 脚本提取 junction reads,结合 MEGAHIT 软件进行序列组装,以鉴定 T-DNA 插入位点和侧翼序列,同时借助 DELLY 和 Manta 工具检测基因组结构变异;此外,还采用了常规 PCR 和桑格(Sanger)测序对插入位点进行验证,利用液滴数字 PCR(ddPCR)技术对基因拷贝数进行确认。
3.1 分子表征分析的原理与生物信息学流程
研究构建了涵盖 T-DNA 整合分析和 SVs 评估的生物信息学流程。通过对测序数据的质量控制,获得 FG72 的有效测序覆盖度为 45.06×。利用定制流程过滤出不同类型的 reads,结合序列组装和比对,成功解析了 T-DNA 的整合结构,并对全基因组 SVs 进行了系统检测。
3.2 FG72 大豆中两个 T-DNA 插入位点及侧翼序列的鉴定与验证
通过生物信息学分析和实验验证,发现 FG72 的 T-DNA 整合到宿主基因组 15 号染色体的两个不同位点,分别为 IS1 和 IS2。IS1 插入位点包含部分 Ph4a748 ABBC 启动子序列,IS2 插入位点存在 25 bp 宿主基因组 DNA 缺失,且两端为 3’HistonAt 元件。同时,检测到宿主基因组 DNA 片段(15 号染色体 13,715,991 至 16,897,687 区域)发生易位。常规 PCR 和 Sanger 测序结果进一步证实了这些插入位点和侧翼序列的准确性。
3.3 FG72 中 T-DNA 拷贝数的确定
基于 PE-WGS 数据的计算和 ddPCR 验证,表明 FG72 中存在两个拷贝的 T-DNA。PE-WGS 通过比较宿主基因组和转基因的覆盖深度,计算出各元件的拷贝数,其中完整 T-DNA 的拷贝数为 2.28,而 ddPCR 对 hppdPfW336 和 2mepsps 基因的拷贝数检测结果分别为 1.68 和 1.69。两者结果结合,确认了 T-DNA 的双拷贝整合,且 IS2 位点存在两个串联重复的 T-DNA 片段。
3.4 组装分析揭示插入位点 2(IS2)的完整结构
通过对过滤后的 type C reads 进行从头组装,获得多个 contigs,结合侧翼序列分析,构建了 IS2 的完整结构模型。结果显示,IS2 由两个部分 3’histoneAt 序列以头对头方向排列,随后是两个头对尾方向的 T-DNA 串联重复片段。尽管短读长测序在组装复杂重复序列时存在局限性,但通过引物扩增验证了 IS2 的结构,为深入理解 T-DNA 整合的复杂性提供了依据。
3.5 FG72 中未检测到质粒骨架序列
将 FG72 和 Jack 的测序数据映射到转化质粒 pSF10 序列,IGV 可视化结果显示,两者均未检测到包含 ORI ColE1、bla 和 ORI f1 基因的质粒骨架序列。偶尔出现的与质粒部分序列匹配的 reads,经分析是由于序列同源性导致的非特异性映射,而非质粒骨架插入,表明 FG72 的 T-DNA 整合过程较为纯净。
3.6 FG72 及其受体中的结构变异(SVs)
利用 DELLY 和 Manta 工具检测到 FG72 和 Jack 中存在多种类型的 SVs,包括易位、缺失、插入和重复。其中,FG72 在插入位点附近存在显著的宿主基因组片段易位和 25 bp 缺失,15 号染色体是 SVs 发生频率较高的区域之一。注释分析表明,大部分变异发生在基因编码区,但转基因株系与非转基因对照的 SVs 类型和数量相近,提示多数变异可能并非由转基因过程直接诱导。
研究结论与讨论
本研究通过 PE-WGS 技术和定制生物信息学流程,首次在全基因组水平上全面解析了转基因大豆 FG72 的分子特征。研究发现其 T-DNA 以双拷贝形式整合到 15 号染色体的两个位点,伴随宿主基因组易位,且未检测到质粒骨架残留。同时,系统鉴定了 FG72 中的 SVs,揭示了转基因过程与基因组变异的关系。
研究结果表明,PE-WGS 相较于传统技术在转基因作物分子表征中具有显著优势,能够高效、精准地提供插入位点、拷贝数、SVs 等全面信息,大幅缩短实验周期并降低成本。尽管短读长测序在解析复杂重复结构时存在局限,但结合实验验证和长读长技术有望进一步提升分析的完整性。
该研究为转基因作物的安全评估提供了新的技术范式,其揭示的 FG72 分子特征为其商业化应用提供了更坚实的科学基础。同时,研究也强调了在转基因作物研发中,结合高通量测序和生物信息学进行全面分子表征的必要性,有助于更客观地评估转基因技术的风险,推动转基因作物的合理开发与应用。