利用长读长测序技术监测体细胞基因组变异速率与动态变化:癌症风险预警新范式

【字体: 时间:2025年06月12日 来源:Scientific Reports 3.8

编辑推荐:

  本研究通过牛津纳米孔长读长测序技术(LRS)对健康人群和癌症患者血液DNA进行纵向全基因组测序,首次实现体细胞单核苷酸变异(sSNV)的实时监测,发现sSNV数量随年龄增长呈线性增加(2.6个/年),并鉴定出SBS5等时间依赖性突变特征。该研究为建立个体化癌症预防"系统状态"监测体系提供了技术基础。

  

在生命的长河中,我们的细胞每经历一次分裂就会在DNA上留下新的突变印记。这些体细胞突变如同时间的沙漏,记录着环境压力与内在修复机制的博弈。虽然人体拥有精密的防护系统,但当突变突破临界点,就可能引发癌症等疾病。然而长期以来,科学家们对体细胞突变的积累速率及其动态变化知之甚少,这主要受限于传统短读长测序技术在低频变异检测和连续监测方面的不足。

美国Ellison医学研究所的Xingyao Chen、Hagai Ligumsky等研究人员在《Scientific Reports》发表的研究,开创性地将牛津纳米孔长读长测序技术(LRS)应用于血液DNA的纵向监测。这项研究通过对103名受试者(包括健康人、现症癌症患者和癌症康复者)进行多次采样,建立了一套能捕捉体细胞基因组"脉动"的技术体系。研究人员开发的计算管道从平均31x覆盖深度的数据中,通过严格的过滤流程从初始检测的1.5百万个SNV中筛选出211,530个高置信度sSNV,为理解突变积累规律提供了高质量数据。

关键技术方法包括:1)使用PromethION R9.4.1平台进行55小时长读长测序;2)基于ClairS深度学习模型的体细胞变异检测;3)采用TensorSignatures和COSMIC SBS特征分析突变过程;4)通过HG002参考基因组建立测序错误模型;5)应用线性混合效应模型分析年龄与突变积累关系。样本来源于Ellison医学研究所门诊患者及工作人员队列,采集间隔为6-18个月。

【Long read sequencing can be used to identify and characterize low frequency single nucleotide variants in a contrived sample】
研究人员通过将乳腺癌细胞系BT-474 DNA按梯度比例(1%-10%)掺入标准参考样本的实验证明,即使在5%掺入比例下仍能线性检测到APOBEC活性相关的SBS2/SBS13特征突变,证实了LRS检测低频变异的能力。但严格的过滤策略也导致仅能回收约1.2%-2.9%的真实突变,这为后续临床应用的灵敏度优化指明了方向。

【Aggressive filtering results in high-confidence somatic SNVs】
通过多级过滤流程(包括去除已知种系变异、低频过滤、黑名单区域排除等),研究者将平均每样本sSNV从147万降至801个,等位基因频率分布从双峰(50%和100%)转变为以20%为中心的单一峰,有效富集了真正的体细胞变异。测序错误特征分析显示,假阳性变异具有完全不同的TensorSignatures特征,证实了过滤策略的特异性。

【Somatic SNVs are enriched in certain functional regions of the genome】
功能区域分析揭示了自然选择对突变频率的塑造作用:mRNA编码区sSNV频率最低,而5'非翻译区(UTR)和同义突变频率最高。引人注目的是,错义突变并未表现出预期的低频特征,暗示中性进化在某些基因组区域可能起主导作用。这一发现挑战了关于体细胞选择压力的传统认知。

【Interpretable mutational signatures differ among individuals】
COSMIC SBS特征分析显示,SBS1(5-甲基胞嘧啶脱氨)和SBS5(未知机制的时钟样特征)在97%样本中存在,而SBS4(烟草相关)等环境特征仅见于特定人群。意外发现的是263个样本中检测到抗癌药物duocarmycin相关特征SBS90,后续实验证实这是技术假象,凸显了区分生物真实信号与技术噪声的重要性。

【The number of somatic SNVs increases over a person's lifetime】
年龄分析揭示sSNV数量与年龄呈显著正相关(斜率2.64,p=0.0027),相当于每十年积累约27个sSNV。这一结果与尸检组织和活检研究结论一致,但首次通过外周血非侵入性检测得以验证。值得注意的是,癌症患者与健康人的突变积累速率无显著差异,提示基础突变过程具有普遍性。

【Different mutational processes accumulate at different rates】
在9-18个月的短时间尺度上,SBS5(斜率10.11,p=1.19E-4)和SBS1(斜率0.73,p=0.011)显示出显著的阳性时间趋势,而其他特征保持稳定。这种"突变时钟"的差异化运转,为实时监测特定突变过程的活动提供了可能。

这项研究开创了多项重要突破:首次证明长读长测序可用于血液sSNV的纵向监测;建立了突变积累的定量模型(2.6 sSNV/年);发现不同突变过程具有异质性时间动力学。尽管存在灵敏度限制和SBS90等技术假象的干扰,该工作为"系统状态"监测奠定了方法学基础。研究者特别指出,未来可通过靶向测序和甲基化等多组学整合进一步提高检测精度。

这项研究的深远意义在于,它将基因组监测从静态"快照"升级为动态"视频",为癌症等年龄相关疾病的早期预警提供了全新维度。正如作者所展望的,这种技术可能发展成类似"胆固醇检测"的常规监测手段,通过捕捉突变速率的异常波动,在临床症状出现前识别高风险个体。随着成本降低和技术优化,这种基于长读长测序的"基因组听诊器"或将开启个性化预防医学的新纪元。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号