
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:单细胞组学测序技术:长读长测序时代
【字体: 大 中 小 】 时间:2025年08月24日 来源:TRENDS IN Genetics 16.3
编辑推荐:
这篇综述系统阐述了基于单分子长读长测序(SMS)技术的单细胞组学研究进展,重点介绍了其在基因组(重复元件/结构变异)、表观组(等位基因特异性修饰)和转录组(可变剪切)层面的突破性应用。文章对比了第三代测序(PacBio/ONT)与二代测序(NGS)的技术差异,详细解析了SMS在检测"暗物质"基因组区域和生物学事件中的独特优势,并展望了单细胞多组学整合与空间转录组等未来发展方向。
二代测序(NGS)虽已革新生物医学研究,但其短读长特性导致难以检测重复元件和可变剪切等复杂生物学事件。单分子长读长测序(SMS)技术通过直接读取原生DNA分子,可产生数千至数百万碱基的连续读长,为解析基因组"暗物质"区域提供了全新工具。重复元件占人类基因组的54%,包含转座子(TEs)和串联重复序列,这些区域在NGS中常因无法唯一比对而被丢弃。SMS技术通过超长读长优势,成功实现了端粒到端粒(T2T)的人类基因组完整组装。
主流SMS平台包括Pacific Biosciences(PacBio)和Oxford Nanopore Technologies(ONT)。PacBio采用零模波导(ZMW)纳米孔实时测序,最新Revio系统每天可产生480Gb高保真(HiFi)数据;ONT利用纳米孔生物传感器检测电信号变化,PromethION系统单次运行可产生14Tb数据。尽管PacBio通过环状共识测序(CCS)策略将准确度提升至99.9%,ONT通过改进孔化学和算法也达到了99%准确度,但两者捕获效率仍不足0.1%,需对单细胞核酸进行至少1000倍扩增。
传统单细胞RNA测序(scRNA-seq)仅能检测转录本末端信息,而SMS技术可直接识别全长RNA异构体。液滴微流控技术如ScISOr-seq能在单细胞分辨率下研究复杂可变剪切事件;平板技术如SCAN-seq可精确识别单细胞中等位基因特异性SNP。ONT平台虽成本较低,但早期版本错误率较高,需通过滚环扩增(RCA)或结合NGS数据进行校正。生物信息学工具如Bambu和IsoQuant通过机器学习显著提高了转录本发现和定量准确性。这些技术已成功应用于揭示小鼠和人类大脑发育过程中神经元与胶质细胞的异构体多样性,以及B细胞受体(BCR)和T细胞受体(TCR)的全长序列分析。
SMOOTH-seq采用Tn5转座和PCR扩增长片段,在二倍体细胞中测序1.2Gb数据可获得6%基因组覆盖度,能有效检测长达7kb的插入事件。Refresh-seq使用限制性酶切策略,单细胞测序0.75Gb数据可获得13%覆盖度。微滴式MDA(dMDA)将平均读长提升至10kb,单细胞测序15.7Gb数据覆盖度达40%。比较分析显示,PacBio平台单细胞SV检测灵敏度是Illumina的16倍。NanoStrand-seq通过保留链特异性信息,实现了全染色体水平的单倍型分相。值得注意的是,SMOOTH-seq还建立了诊断性特征来识别小于10kb的染色体外环状DNA(ecDNA),在K562细胞中验证了90%的候选分子。
scNanoATAC-seq通过长读长测序Tn5标记片段,采用读段末端峰识别策略,可同时检测染色质可及性和遗传变异。scNanoSeq-CUT&Tag技术平均读长4kb,对异染色质标记如H3K9me3的捕获效率显著提高。单细胞Hi-C技术scNanoHi-C平均读长3kb,能解析高阶染色质结构,发现1097个基因启动子与多个增强子同时相互作用的现象。这些技术还成功检测了LINE-1和长末端重复序列(LTR)中的染色质可及区域,以及小鼠植入前发育中Xist与Tsix域的等位基因特异性可及性变化。特别值得注意的是,scNanoATAC-seq2在二细胞期发现了>100个全长LINE-1元件的激活,这可能促进基因组转座。
SMS技术为单细胞多组学研究开辟了新途径:在转录组层面有望实现单细胞分辨率的长读长空间转录组;在基因组层面或可实现单细胞水平的完整组装;在表观组层面能深入探索着丝粒和rDNA等复杂区域。随着技术发展,未来可能实现以下突破:1)直接测序天然基因组DNA;2)解析RNA修饰与剪接的共调控;3)构建人类表观基因组图谱。这些进展将极大推动对发育异常、癌症进化等疾病机制的理解,为精准医疗提供新工具。
生物通微信公众号
知名企业招聘