
-
生物通官微
陪你抓住生命科技
跳动的脉搏
纳米孔测序与杂交SNP微阵列在人类基因组大片段拷贝数变异检测中的比较分析
【字体: 大 中 小 】 时间:2025年07月25日 来源:Molecular Cytogenetics 1.3
编辑推荐:
本研究针对结构变异检测的技术瓶颈,创新性地比较了纳米孔测序(Nanopore Sequencing)与杂交SNP微阵列(hybrid-SNP microarray)在人类基因组拷贝数变异(CNV)检测中的性能。研究人员通过对两种白血病细胞系(EOL-1和697)的低深度测序(11-13X)分析,发现纳米孔测序可识别79%的CMA验证变异(间质变异达86%),并精准定位变异断点(平均误差仅20bp),同时揭示了CMA无法检测的基因组倒位现象。该研究为临床遗传诊断提供了更高分辨率的检测方案,推动第三代测序技术在结构变异分析中的应用。
人类基因组中结构变异(Structural Variation, SV)的检测一直是遗传学研究的难点,尤其是大片段拷贝数变异(Copy Number Variation, CNV)与多种遗传病和癌症密切相关。当前临床主流的染色体微阵列技术(Chromosomal Microarray, CMA)虽能检测CNV,但存在分辨率有限、无法识别倒位等复杂变异的缺陷。随着第三代测序技术的发展,纳米孔测序(Nanopore Sequencing)因其超长读长特性,为结构变异研究带来了新机遇。
葡萄牙国家卫生研究院(National Institute of Health)技术创新部门的研究人员开展了一项开创性研究,系统比较了纳米孔测序与杂交SNP微阵列(hybrid-SNP microarray)在CNV检测中的性能。研究选取两种特征明确的白血病细胞系(EOL-1和697),通过低深度(11-13X)纳米孔测序,结合CuteSV和Sniffles2两种变异检测算法,与CMA金标准进行变异层面的比对。该研究成果发表于《Molecular Cytogenetics》,为临床基因组分析提供了重要技术参考。
研究采用的主要技术包括:1)基于CytoScan HD?阵列的CMA分析;2)牛津纳米孔MinION平台全基因组测序;3)LRA比对与CuteSV/Sniffles2双算法变异检测;4)Sanger测序验证断点精度;5)覆盖深度分析(mosdepth)评估未检出变异。
通过CMA验证的48个CNV(35kb-80Mb)中,纳米孔测序成功检出79.2%(间质变异达86.4%)。双算法联合使用将检出率提升4.2%,其中缺失变异(83.3%)比重复变异(61.1%)更易识别。值得注意的是,四个被CMA判定为CNV的变异经纳米孔测序证实为伴随内部缺失的倒位,凸显了长读长测序在复杂变异解析中的优势。
CMA与测序数据的变异尺寸呈现高度相关性(Pearson r=0.975),但63%的变异在CMA中尺寸偏大。Sanger测序验证显示,纳米孔测序断点定位平均误差仅20bp,其中697细胞系5号染色体缺失变异还发现了一段9bp的未知来源插入序列。
在10个未检出的CNV中,8个(包括5个缺失和3个重复)通过覆盖深度分析显示出明确的拷贝数变化证据,提示算法优化空间。特别值得注意的是,三个端粒区域CNV因算法局限未能检出,但覆盖深度变化显著。
经过严格过滤(去除BND/INV/INS型变异及低频率变异),双算法联合使用的精确度、召回率和F1-score分别为16.9%、36.2%和22.9%,反映出在保证高特异性的同时,灵敏度仍有提升需求。
该研究证实,即使低深度(<15X)纳米孔测序也能有效识别大多数临床相关CNV,且具备以下突破性优势:1)单碱基级断点定位;2)复杂变异(如倒位)解析能力;3)多类型变异同步检测。然而,算法在端粒区域变异识别和重复变异检测方面仍需改进。
这项研究为基因组结构变异检测提供了新的技术路线,其创新性体现在:首次系统评估了纳米孔测序替代CMA的可行性,建立了双算法联合分析策略,并通过覆盖深度分析揭示了算法改进方向。随着测序成本降低和算法优化,纳米孔测序有望成为遗传病诊断和癌症基因组分析的新标准。
生物通微信公众号
知名企业招聘