
-
生物通官微
陪你抓住生命科技
跳动的脉搏
模糊测序技术:突破DNA片段计数与基因分型的信息效率瓶颈
【字体: 大 中 小 】 时间:2025年07月03日 来源:Nature Biomedical Engineering 27.7
编辑推荐:
本研究针对当前高通量测序技术信息效率低下的核心问题,开发了基于双核苷酸添加流式(BitSeq)和超比特测序(SuperBitSeq)的模糊测序策略。通过创新的氟原性测序化学和微流控芯片技术,实现了>2 bits/cycle的信息效率,在CNV检测、NIPT、RNA-seq等应用中展现出比传统CRT测序更快的周转速度和更高准确性,为基因组学研究提供了新型工具。
基因组测序技术近年来虽取得长足进步,但传统循环可逆终止(CRT)测序方法的信息效率始终局限在2 bits/cycle。这种效率瓶颈导致测序周期长、成本高,特别是在需要精确DNA片段计数的应用中,如拷贝数变异(CNV)检测、无创产前检测(NIPT)和转录组分析(RNA-seq)等。更关键的是,现有技术难以兼顾单碱基分辨率和高效信息编码,这成为制约临床诊断和基础研究的重要技术壁垒。
针对这一挑战,清华大学的研究团队在《Nature Biomedical Engineering》发表了一项突破性研究。他们创新性地提出"模糊测序"概念,通过重新设计测序信息编码方式,开发出信息效率超过传统方法两倍的新型测序技术。该研究不仅构建了功能完备的高通量模糊测序仪原型机,更在多种应用场景中验证了其优越性能,为基因组学研究提供了全新的技术路径。
研究团队主要采用了三项核心技术:1)基于末端磷酸标记氟原性核苷酸(TPLFN)的测序化学,实现核苷酸延伸数与荧光信号的线性对应;2)双核苷酸添加流式(BitSeq)和超比特测序(SuperBitSeq)策略,通过交替添加混合核苷酸提高信息密度;3)30飞升微流控芯片阵列,采用可逆油封技术防止荧光信号交叉干扰。临床样本包括先天性心脏病患者外周血DNA、孕妇游离DNA(ccfDNA)以及社区获得性肺炎患者的支气管肺泡灌洗液等。
【结果】
研究团队开发的模糊测序策略突破了传统四碱基编码限制,通过交替添加混合核苷酸(如K=G/T,M=A/C)实现信息压缩。BitSeq采用双色荧光系统,信息效率达2.32 bits/cycle;而SuperBitSeq使用东京绿(TG)和北京橙(PO)双荧光标记,效率进一步提升至3.32 bits/cycle。这种设计使相同循环数下可获得更长读长,如61循环平均读长达112.2 bp。
构建的实验室原型测序仪包含2800万个30飞升微反应室,采用温度触发(4-65°C)的氟原性SBS化学。在λ噬菌体基因组测试中,6,578,364条reads的比对率达99.11%,错误率首10 bp仅0.39%。微流控芯片的油封技术使信号串扰低于1%,解决了扩散导致的信号混合问题。
在唐氏综合征(21三体)和DiGeorge综合征(22q11.2缺失)检测中,BitSeq表现出比Ion Torrent更低的绝对配对差异中位数(MAPD)。对2.9 Mb的22q11.2缺失检测,BitSeq与常规方法一致性达100%,且所需测序循环数减少30%。
在12例模拟三体样本(21/18/13三体)和28例真实临床样本中,BitSeq在胎儿DNA占比≥3.5%时能准确识别三体(Z>3)。对10例单盲样本检测结果与临床诊断完全一致,证实其临床适用性。
在儿科多器官脓肿患者的咽拭子样本中,BitSeq与Illumina检测的病原体种类和丰度高度一致(R2>0.95)。小鼠胚胎干细胞(mES)和成纤维细胞(mEF)的RNA-seq数据显示,BitSeq与常规测序的基因表达相关性达0.98,检测基因数差异<5%。
通过EGFR基因G719S/T790M突变检测实验,SuperBitSeq成功区分单碱基差异的DNA模板。在SARS-CoV-2样本测序中,42.6分钟内获得20万条reads,SNV检出率比BitSeq提高83%,错误率<1%。
【结论与讨论】
这项研究从根本上改变了DNA测序的信息编码范式,通过模糊测序策略实现了信息效率的突破。其核心价值体现在三个方面:首先,双核苷酸流式设计使单位循环信息量提升116%,大幅缩短了CNV、NIPT等依赖片段计数应用的检测时间;其次,创新的氟原性化学结合微流控密封技术,解决了高通量下的信号保真问题;最重要的是,SuperBitSeq通过双色荧光系统实现了单碱基变异检测,填补了模糊测序在精准医学中的应用空白。
研究还揭示了模糊编码的数学特性——SuperBitSeq信号在[0,1)×[0,1)空间形成豪斯多夫维数≈1.7716的分形结构,这为开发新型序列比对算法提供了理论基础。尽管当前技术仍需优化操作流程和降低成本,但其在表观遗传学(如甲基化测序)和三维基因组(如Hi-C)等领域的应用前景已清晰显现。这项技术突破不仅为基因组学研究提供了新工具,更重新定义了测序信息效率的理论上限。
生物通微信公众号
知名企业招聘