外显子组测序鉴定出HELB是一种新的非粘液性、非高级别浆液性上皮性卵巢癌的易感基因

【字体: 时间:2025年02月13日 来源:European Journal of Human Genetics 3.7

编辑推荐:

  在过去 30 年里,上皮性卵巢癌遗传风险因素的研究取得了显著进展。20 世纪 90 年代,通过连锁研究发现了 “高外显率” 基因 BRCA1 和 BRCA2,这两个基因的蛋白质截断变异会大幅增加上皮性卵巢癌以及乳腺癌和其他癌症的终生患病风险。此外,上皮性卵巢癌也是林奇综合征(Lynch Syndrome,一种与错配修复基因突变相关的遗传性疾病,患者患多种癌症的风险增加)表型的一部分,错配修复基因的蛋白质截断变异与之相关。同时,BRIP1、PALB2、RAD51C 和 RAD51D 等基因的罕见编码变异也被证实会带来一定的患病风险。近 15 年来,卵巢癌协会联盟(Ovarian Cancer Association Consortium,OCAC)开展的大规模全基因组关联研究(genome-wide association studies,GWAS)已鉴定出 40 多个常见的易感等位基因。

  

剑桥大学公共卫生与初级保健系(Department of Public Health and Primary Care, University of Cambridge)的研究人员 Ed M. Dicks 等人在《欧洲人类遗传学杂志》(European Journal of Human Genetics)上发表了题为 “Exome sequencing identifies HELB as a novel susceptibility gene for non-mucinous, non-high-grade-serous epithelial ovarian cancer” 的论文。这篇论文在卵巢癌研究领域意义重大,为揭示上皮性卵巢癌(epithelial ovarian cancer,EOC)的遗传致病机制提供了新的见解,有望为卵巢癌的早期筛查、精准预防和个性化治疗开辟新方向。


研究背景


在过去 30 年里,上皮性卵巢癌遗传风险因素的研究取得了显著进展。20 世纪 90 年代,通过连锁研究发现了 “高外显率” 基因 BRCA1 和 BRCA2,这两个基因的蛋白质截断变异会大幅增加上皮性卵巢癌以及乳腺癌和其他癌症的终生患病风险。此外,上皮性卵巢癌也是林奇综合征(Lynch Syndrome,一种与错配修复基因突变相关的遗传性疾病,患者患多种癌症的风险增加)表型的一部分,错配修复基因的蛋白质截断变异与之相关。同时,BRIP1、PALB2、RAD51C 和 RAD51D 等基因的罕见编码变异也被证实会带来一定的患病风险。近 15 年来,卵巢癌协会联盟(Ovarian Cancer Association Consortium,OCAC)开展的大规模全基因组关联研究(genome-wide association studies,GWAS)已鉴定出 40 多个常见的易感等位基因。


上皮性卵巢癌主要有五种组织学类型,即高级别浆液性、低级别浆液性、透明细胞性、子宫内膜样和黏液性,它们在疾病风险的遗传因素上既有共性,也存在显著差异。例如,BRCA1、BRCA2 等基因的高、中度外显风险变异易导致高级别浆液性 EOC,而错配修复基因的功能丧失变异则与子宫内膜样和透明细胞性 EOC 相关。常见风险等位基因对不同组织学类型的风险影响也有所不同,黏液性组织学类型与其他类型差异尤为显著。


尽管如此,目前已确定的罕见和常见风险等位基因仅能解释约 30% 的上皮性卵巢癌遗传易感性,全基因组遗传力分析显示常见变异只能解释约 40% 的家族聚集性(芯片遗传力)。大量研究表明,罕见变异可能在剩余的家族聚集性中起重要作用,但由于样本量限制,目前仅对少数基因(主要是 DNA 修复相关基因)进行了风险关联研究,可能还有许多具有相似风险的基因尚未被发现。因此,开展这项研究旨在识别与上皮性卵巢癌风险相关的携带罕见编码功能丧失变异(loss of function,LoF)的基因。


研究方法


  1. 病例和对照数据集:研究人员从多个来源整理了多种上皮性卵巢癌病例系列的生殖系全外显子组测序(whole exome sequencing,WES)数据和全基因组测序(whole genome sequencing,WGS)数据(以 BAM 或 CRAM 文件形式),对照测序数据则全部来自英国 Interval 研究(一群健康的英国献血者)。分析时排除了黏液性卵巢癌病例,最终纳入 1638 例病例和 4502 例对照的外显子组或全基因组测序数据,同时还使用了英国生物银行(UK Biobank,UKB)发布的 1099 例 EOC 病例和 9423 例无癌对照的 WES 测序变异调用数据(以 VCF 文件形式)。

  2. 变异检测和筛选:所有 BAM/CRAM 文件均比对到人类基因组版本 hg19/GRCh37,UK Biobank 的 VCF 调用数据基于 GRCh38 构建,经转换后纳入分析流程。研究人员使用多种工具对数据进行处理,如用 picard 测序工具去除重复序列读取,用 samtools 软件进行序列读取的分区和常规操作,用基因组分析工具包(Genome Analysis ToolKit,GATK)UnifiedGenotyper 3.8 - 1 版本进行变异检测,并遵循最佳实践指南。变异注释使用 ANNOVAR 软件,参考 UCSC RefSeq 基因转录本集。对变异进行严格筛选,定义罕见变异为在非 UKB 对照和病例中次要等位基因频率(minor allele frequency,MAF)≤0.1% 的变异,同时对变异进行人工视觉检查,排除有疑问的变异,并进行质量控制(quality control,QC),排除不符合哈迪 - 温伯格平衡(Hardy-Weinberg equilibrium)、缺失率 > 20% 以及与上皮性卵巢癌关联检验 p 值≤10??且无罕见对照等位基因的变异位点。

  3. 变异分类:依据多种标准将变异定义为功能丧失变异,包括导致蛋白质截断的变异(如终止密码子获得变异、移码插入 / 缺失变异和经典剪接位点变异)、非经典剪接位点变异和靠近外显子剪接边界 3bp 内的外显子内变异(经 MaxEntScan 算法预测会破坏剪接,且野生型 MaxEntScan 评分≥3 且与参考序列相比降低 > 40% 的变异被认为有害),以及被多个提交者提交到 NCBI ClinVar 数据库且被指定为致病性或可能致病性且无冲突的错义单核苷酸变异或框内插入 / 缺失变异。

  4. 样本质量控制和排除:若样本满足以下任一标准则被排除:平均覆盖深度在 10x 时 <25%、功能丧失变异调用过多(>1000)、外显子组数据变异调用与芯片基因分型调用的一致性 < 95%,以及基于常见变异调用确定为已知重复或潜在重复样本。经过排除后,非 UKB 组剩余 1474 例病例和 4500 例对照,UKB 组剩余 1099 例病例和 9423 例对照。

  5. 芯片基因分型数据:利用芯片基因分型数据调整罕见变异检测的筛选条件,检查样本命名的准确性,并作为非 UKB 样本质量控制的额外手段。这些数据来自卵巢癌协会联盟的四个不同基因分型项目(OncoArray、iCOGS、外显子芯片和卵巢 GWAS)以及癌症基因组图谱(The Cancer Genome Atlas,TCGA)。

  6. 统计方法:进行基因逐个的简单负担检验,分析罕见功能丧失变异与所有非黏液性卵巢癌、高级别浆液性卵巢癌和非高级别浆液性卵巢癌的关联。将个体按基因分为功能丧失变异携带者或非携带者,通过逻辑回归调整前四个主成分以考虑潜在的群体结构和遗传祖先,同时调整研究分层(非 UKB、UKB 50K 样本集和 UKB 非 50K 样本集)。计算基于 Benjamini 和 Hochberg 方法的错误发现概率(false discovery rate,FDR)以及基于 Wakefield 方法的贝叶斯错误发现概率(Bayes False Discovery Probability,BFDP)。此外,使用 R 包 TwoSampleMR 中的五种不同方法(MR Egger、加权中位数、逆方差加权、简单模式和加权模式)进行孟德尔随机化分析,并使用 R 软件的 patchwork 和 tidyverse 包进行其他分析。


研究结果


  1. 初步分析:对通过质量控制的非 UKB 组 1474 例病例和 4500 例对照的所有基因进行初步分析,发现 12761 个基因中至少有一个病例或对照携带 MAF<0.1% 的功能丧失变异,其中 4623 个基因有足够的致病性变异携带者可进行风险估计。检验统计量未出现明显膨胀,表明数据协调过程有效避免了病例和对照测序系统差异带来的潜在偏差。737 个基因的关联 P 值 < 0.05,这些基因与先前已确认或提示为卵巢癌易感基因的 ATM、BARD1 等一起在 UKB 数据中进行进一步分析。

  2. 基因关联分析:综合分析非 UKB 和 UKB 数据,进行罕见功能丧失变异与不同类型卵巢癌的关联分析。结果显示,在错误发现率 < 0.2 的情况下,有 31 个基因与卵巢癌相关;在错误发现率 < 0.1 时,有 12 个基因与之相关,其中 7 个是已知的卵巢癌易感基因,包括 BRCA1、BRCA2 等,另外 5 个是新发现的基因,即 OR2T35、HELB、MYO1A、GABRP 和 MIGA1。BRCA1、BRCA2 等 7 个基因与高级别浆液性卵巢癌关联更强,而 MSH6、OR2T35 等 5 个基因与非高级别浆液性组织学类型关联更显著。

  3. HELB 基因相关分析:HELB 基因编码 DNA 解旋酶 B,参与 DNA 复制、修复、重组和转录过程中的解旋。该基因的罕见有害变异与自然绝经年龄较晚相关,研究人员通过孟德尔随机化分析发现,遗传预测的自然绝经年龄与子宫内膜样卵巢癌存在强关联(五种孟德尔随机化方法均显示 P<0.05),与透明细胞卵巢癌有一定关联(两种方法显示 P<0.05),与其他组织学类型关联不明显。在携带 HELB 功能丧失变异的卵巢癌病例中,有三例为子宫内膜样组织学类型,两例为低级别浆液性。对肿瘤 DNA 的分析也发现,仅在一例子宫内膜样病例中检测到 HELB 的致病性变异,这些结果表明 HELB 蛋白截断变异与非高级别浆液性卵巢癌的关联是真实存在的。

  4. 其他基因分析:GABRP 编码 γ - 氨基丁酸 A 受体,其亚基在子宫和卵巢等非神经组织中表达,有证据表明它参与卵巢癌细胞的侵袭和迁移。然而,OR2T35 和 MYO1A 与卵巢癌生物学之间的联系尚不明确。此外,NBN 基因编码的 nibrin 参与 DNA 双链断裂修复和 DNA 损伤诱导的检查点激活,其蛋白截断变异与尼曼 - 匹克病(Nijmegen breakage syndrome,一种常染色体隐性遗传病,患者有小头畸形、生长迟缓、免疫缺陷、癌症易感性和女性早发性卵巢功能衰竭等症状)相关,虽之前研究未发现其与非高级别浆液性卵巢癌有显著关联,但在本研究中它是潜在的卵巢癌易感基因。


研究结论与讨论


研究人员通过对大量上皮性卵巢癌病例和对照的全外显子组测序,深入探究了生殖系中罕见的功能丧失编码变异与上皮性卵巢癌风险之间的关系。研究证实了 6 个已知与高级别浆液性卵巢癌相关的基因,同时发现了 HELB 基因与非黏液性、非高级别浆液性卵巢癌的新关联。尽管研究存在一定局限性,如检测具有中等效应的罕见变异的能力有限,样本量限制导致检测较弱效应变异的效能不足,疾病异质性也可能影响研究结果,但这一发现仍具有重要意义。


这一研究成果为深入理解上皮性卵巢癌的遗传病因提供了新线索,有助于进一步完善卵巢癌的遗传风险评估模型。对于携带 HELB 等相关基因变异的个体,可进行更有针对性的早期筛查和预防干预,如更频繁的妇科检查、采用预防性手术等措施,从而实现卵巢癌的精准预防。在个性化治疗方面,明确这些易感基因有助于医生根据患者的基因特征制定更精准的治疗方案,提高治疗效果,改善患者预后。未来,需要更大规模的病例对照测序研究来更精确地评估相关风险,并确定这些基因在不同组织学类型卵巢癌中的具体风险,进一步挖掘潜在的卵巢癌易感基因,为卵巢癌的防治带来新的突破。


相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号