编辑推荐:
Gaucher 病(GD)和帕金森病(PD)等与 GBA1 基因变异相关。为探究 Gauchian 软件对 GBA1 变异基因分型的可靠性,研究人员对比其与桑格测序结果。结果显示该软件存在漏检、误判等问题。这为评估其在相关疾病诊断中的应用提供依据。
Gaucher 病(GD)是一种由于 GBA1 基因双等位基因突变,导致编码的溶酶体酶葡萄糖脑苷脂酶(E.C.3.2.1.45)出现异常的疾病。目前已发现超 500 种 GBA1 致病突变,它不仅与 GD 密切相关,还是帕金森病(PD)和路易体痴呆(DLB)已知的最常见遗传风险因素 。然而,GBA1 基因下游约 16kb 处存在高度同源的假基因 GBAP1,其与 GBA1 在编码区有 96% 的同源性,在 8 号内含子到 3’非翻译区(UTR)相似度更是高达约 98%,这使得变异检测和序列分析困难重重。再加上相邻的 MTX1 基因及其假基因 MTX1P 也易引发 DNA 重排,进一步增加了检测的复杂性。传统检测方法如直接桑格测序、定量实时 PCR、Southern 印迹和全基因组测序(WGS)虽能检测常见重组等位基因,但各有局限性。在此背景下,新软件 Gauchian 应运而生,它旨在利用短读长全基因组测序数据来鉴定 GBA1 变异,包括点突变和重组等位基因。但它的可靠性究竟如何呢?这成为科研人员亟待探究的关键问题。
美国国立卫生研究院(National Institutes of Health)国家人类基因组研究所医学遗传学分支等机构的研究人员开展了一项研究,以评估 Gauchian 软件在 GBA1 变异基因分型中的可靠性。研究结果表明,Gauchian 软件在基因分型方面存在诸多问题,不能作为独立的诊断工具,这一结论为相关疾病的准确诊断和研究敲响了警钟。该研究成果发表在《Communications Biology》上。
研究人员采用了以下主要技术方法:从 95 名患者(90 例 GD 患者和 5 名已知的 GBA1 变异携带者)的样本中提取高分子量 DNA。对每个样本同时进行桑格测序和全基因组测序。桑格测序使用特定引物和协议确定 GBA1 相关基因型,全基因组测序则利用 TruSeq? DNA PCR-Free HT 样本制备试剂盒构建测序文库,并在 NovaSeq 6000 平台上测序。此外,还利用 Gauchian 软件对测序数据进行分析,并与桑格测序结果对比评估其性能。
下面详细介绍研究结果:
- Gauchian 软件与桑格测序的对比评估:研究人员将 Gauchian 软件在 95 个样本中的检测结果与桑格测序确定的基因型进行比较。结果发现,Gauchian 仅在 84 个样本中正确预测了 GBA1 基因型。在 11 个不一致的结果中,有 3 个样本软件无法确定片段拷贝数而报告 “None”,但实际测序深度充足。从单个等位基因来看,在 193 个错义突变和重组等位基因中,有 26 个被错误识别,错误率达 13.40%,部分常见和罕见突变均存在漏检情况。综合计算,该软件的灵敏度为 0.9275,特异性为 0.9977;排除因覆盖度不均被排除的 6 个等位基因后,灵敏度提升至 0.9572,特异性不变。
- 不同参考基因组对 Gauchian 软件性能的影响:由于 Gauchian 软件支持不同人类基因组参考序列的数据分析,研究人员对比了其在 b37(hg19)和 hg38 两个版本下的性能。结果显示,多数预测结果一致,但仍有 4 例存在明显差异。在部分样本中,不同参考基因组下软件对突变的识别、拷贝数的报告均存在差异,表明参考基因组的选择对软件性能有影响。
- Gauchian 软件对重组等位基因的检测情况:在 95 例样本中,4 例携带重组等位基因。Gauchian 软件虽能正确报告部分 RecNciI 案例,但对其中一些样本的详细分析发现,软件未能准确识别已知的错配位点,且在拷贝数报告上存在错误。对于其他重组等位基因如 RecTL + c.1263del 和 Rec7,软件同样存在检测不准确的问题,包括漏检重组突变和误报拷贝数增加等情况。
- Gauchian 软件对基因转换事件的检测能力:研究中发现 4 例患者携带 9 号外显子 c.1263del(55bp del)的等位基因,Gauchian 软件仅在 1 例中正确识别出基因融合事件(表示为拷贝数损失),说明其在检测基因转换相关变异时也存在局限性。
- Gauchian 软件在不同覆盖度基因组数据中的表现:研究人员利用 1000 Genomes 项目 3 期的低覆盖度和高覆盖度基因组数据进一步评估。在低覆盖度基因组中,软件检测出 20 例双等位基因变异;高覆盖度下虽检测出部分变异携带者,但仍存在漏检和 “无调用” 情况。综合两个队列数据,软件的灵敏度为 0.9275,特异性为 0.9985,精度为 0.9372,准确度为 0.9968 。
研究结论和讨论部分指出,Gauchian 软件目前存在诸多局限性。它只能检测数据库中包含的 121 种已知 GBA1 变异和 3 种重组等位基因,无法识别一些相对常见、罕见或新发突变,且数据库更新不及时,这可能导致将携带者或患者误判为正常,影响临床诊断和 PD 数据分析。软件在识别拷贝数和结构变异方面也存在困难。因此,研究人员建议为该软件添加输入过滤器,防止不适合的数据被处理;同时应扩充变异列表来源,纳入更多数据库信息。此外,强调任何用于临床目的的结果都需用桑格测序或其他方法验证,尤其是对新生儿或疑似 GD 儿童进行基因分型时。未来研究应在更大队列中对比桑格测序、拷贝数分析、WGS 和 Gauchian 软件预测结果,纳入更多已知复杂等位基因个体。该研究为准确评估 Gauchian 软件在相关疾病基因诊断中的应用提供了重要依据,有助于推动相关疾病诊断技术的改进和完善,避免因不准确的基因分型导致的误诊和错误治疗,对罕见病和神经疾病的研究和临床实践具有重要意义。