基于长读长全基因组测序揭示CYP2A7/CYP2A6种系杂交体与肺癌突变负荷的关联

《Scientific Reports》:Novel CYP2A7/CYP2A6 germline hybrids associated with mutation burden in lung cancer revealed by whole-genome long-read sequencing

【字体: 时间:2025年11月22日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对CYP2A6基因区域因高同源性导致短读长测序难以准确识别结构变异(SV)的难题,采用长短读长全基因组测序联用技术,在20例日本实体癌患者中发现3种新型CYP2A7/CYP2A6种系杂交体,并证实CYP2A6缺失型患者肿瘤突变负荷(TMB)显著低于保留型,且吸烟相关突变特征SBS4仅存在于保留型肺癌。该研究为解析同源区SV提供了新方法,揭示了种系SV对肺癌突变积累的调控作用。

  
在肺癌的发生发展中,吸烟是公认的主要风险因素。而人体内一种名为CYP2A6(细胞色素P450家族2亚家族A成员6)的酶,在尼古丁和烟草中特定致癌物(如NNK)的代谢过程中扮演着关键角色。有趣的是,人群中存在广泛的CYP2A6基因变异,这些变异会影响酶的活性,进而可能改变个体对烟草相关癌症的易感性。例如,CYP2A6功能缺失的个体,其尼古丁代谢速率较慢,吸烟成瘾性可能更低,罹患肺癌的风险也相对降低。因此,准确鉴定CYP2A6的基因型对于评估个体癌症风险和理解吸烟致癌机制具有重要意义。
然而,精准解析CYP2A6基因却面临着一个巨大的技术挑战。在人类基因组中,CYP2A6有一个高度相似的“邻居”基因——CYP2A7,两者的序列相似度超过90%。这种高同源性使得传统的短读长测序技术难以将测序得到的短DNA片段准确无误地定位到CYP2A6或CYP2A7上,尤其是在这两个基因之间发生结构变异时,例如形成嵌合杂交基因或发生基因拷贝数变异。这就像试图用只显示几个字母的碎片去拼凑两篇非常相似的文章,很容易张冠李戴。此前的研究方法,如基于外显子组测序或特定基因panel测序,在解析这类复杂区域时往往力不从心,可能导致对CYP2A6变异类型的误判或漏检,限制了我们全面理解其生物学和临床意义。
为了解决这一瓶颈问题,由日本静冈癌症中心研究中心的Sumiko Ohnami和Keiichi Hatakeyama共同领导的研究团队,在《Scientific Reports》上发表了他们的最新研究成果。他们创新性地联合运用了短读长全基因组测序和长读长全基因组测序技术,对20名日本实体癌患者的种系DNA进行了深入分析。长读长测序能够产生长达数千碱基对的序列读数,如同拥有了能阅读整段文字的“视力”,从而能够跨越高同源区域,清晰描绘出CYP2A6和CYP2A7基因的结构全景,特别是准确识别出两者之间的杂交断点。
为了开展这项研究,研究人员主要运用了以下几项关键技术:他们从20名日本实体癌患者(包括肺腺癌、肺鳞癌等)的手术血液样本中提取DNA,首先进行了高深度的Illumina短读长全基因组测序用于检测拷贝数变异和初步的结构变异;随后,利用Illumina Complete Long Read技术进行长读长全基因组测序,以精确解析CYP2A6/CYP2A7高同源区的复杂结构;通过整合长短读长数据并辅以BLAT序列比对工具,推断出候选的杂交等位基因结构;最后,通过设计特异性引物进行长片段PCR扩增,并结合Sanger测序对预测的结构变异断点进行了实验验证。
患者选择
研究纳入了20例患有不同实体癌的日本患者,包括11例肺腺癌、3例肺鳞癌等。选择标准基于前期短读长测序提示可能存在CYP2A6拷贝数变异或已知存在CYP2A6全基因缺失。所有样本均接受了短读长和长读长全基因组测序。
联合SRS和LRS分析
测序数据显示,短读长测序平均深度为52.8x,长读长测序平均深度为81.1x,平均读长为4698±2945 bp。通过整合两种测序数据并在Integrative Genomics Viewer中进行可视化,研究人员在18个样本中检测到了结构变异。分析发现,在CYP2A6/CYP2A7区域存在复杂的缺失和杂交现象。例如,在一个代表性病例中,短读长测序显示CYP2A7和CYP2A6的部分外显子区拷贝数为1,而基因间区拷贝数为0;长读长测序则进一步揭示了大片段缺失,其序列读段跨越了CYP2A7和CYP2A6的边界。通过BLAT比对,确认这些长读段分别与CYP2A6和CYP2A7的序列高度匹配,表明存在CYP2A7/CYP2A6杂交等位基因。
CYP2A6及相邻CYP2A7等位基因的PCR验证
为了验证测序发现的杂交体,研究人员设计了三对PCR引物对候选区域进行扩增,并通过Sanger测序确认了杂交断点的精确位置。结果共鉴定出四种类型的等位基因结构:三种是新型的CYP2A7/CYP2A6杂交体(分别命名为a, b, d),其断点分别位于内含子1、内含子3和内含子5;另一种是已知的CYP2A6全基因缺失类型(c,对应PharmVar数据库中的*4等位基因)。新型杂交体(a, b, d)尚未在PharmVar等数据库中报道,根据其结构(a型:CYP2A7外显子1与CYP2A6其余部分融合;b型:CYP2A7外显子1-3与CYP2A6融合;d型:CYP2A7外显子1-5与CYP2A6融合),预测可能导致CYP2A6酶功能丧失。
正常CYP2A6与肿瘤突变积累的关联
接下来,研究人员探讨了种系CYP2A6功能状态与肿瘤突变特征之间的关系。他们将患者分为两组:“缺失型”(指两个等位基因均丧失CYP2A6功能,包括*4缺失或携带两个预测无功能的杂交等位基因)和“保留型”(至少保留一个完整的CYP2A6等位基因)。分析发现,在肺癌患者中,缺失型个体的肿瘤突变负荷(TMB)显著低于保留型个体,且所有缺失型肺癌的TMB均低于10个突变/Mb。此外,与吸烟相关的突变特征SBS4在缺失型肺癌中均未检测到,即使在重度吸烟者中也是如此;而在86%的保留型肺癌中检测到了SBS4。相反,在75%的吸烟缺失型肺癌中发现了另一种突变特征SBS92。值得注意的是,在肺癌以外的其他癌种中,无论吸烟状态如何,保留型CYP2A6并未导致TMB的显著升高,也未检测到SBS4或SBS92。这些结果表明,具有完整CYP2A6基因的个体,其肺组织在吸烟暴露下更易积累由烟草致癌物介导的特定类型DNA突变。
综上所述,本研究通过长短读长全基因组测序联用的策略,成功克服了CYP2A6/CYP2A7高同源区域的分析难题,发现了三种新型的CYP2A7/CYP2A6种系杂交体。更重要的是,研究首次将种系结构变异与体细胞突变积累联系起来,证实了功能性CYP2A6等位基因的缺失能够显著降低肺癌中的突变负荷和吸烟相关突变特征的富集。这不仅深化了我们对CYP2A6在吸烟相关肺癌中作用机制的理解,凸显了种系基因组结构对体细胞突变过程的潜在影响,也为利用长读长测序技术探索其他复杂基因组区域提供了范本。该研究成果对于未来开发基于CYP2A6基因型的肺癌风险预测和个性化预防策略具有重要的启示意义。尽管样本量有限且功能验证尚待完成,但这项研究无疑为理解基因结构变异在癌症发生中的作用开辟了新的视角。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号