马耳他人群可报告次要发现(SF)的频谱与频率:推动精准医疗与人群基因组学发展的关键数据

【字体: 时间:2025年09月21日 来源:Molecular Genetics & Genomic Medicine 1.6

编辑推荐:

  本研究首次系统分析马耳他人群临床外显子组测序数据,揭示可报告次要发现(SF)的流行率(3.4%)及分子谱系特征,为地中海隔离人群的基因组医学及国家生物样本库(DwarnaBio)建设提供关键流行病学依据,推动区域性精准医疗框架发展。

  

1 引言

随着新一代测序技术(特别是外显子组与全基因组测序)在临床诊断中的广泛应用,次要发现(Secondary Findings, SFs)的识别已成为临床与伦理实践中的重要议题。SFs指在与检测主要适应症无关的基因中发现的致病性或可能致病性(Pathogenic/Likely Pathogenic, P/LP)变异,这些基因通常具有明确的医疗可行动性(actionability),即存在基于证据的干预措施可用于疾病预防、监测或治疗。美国医学遗传学与基因组学学会(ACMG)为此制定了可报告SF的基因列表(当前版本为ACMG SF v3.2,包含81个基因),以标准化临床报告。然而,不同人群之间SF的发生频率和疾病谱存在显著差异,这种差异源于人群遗传背景、筛查策略、基因选择及变异解读方法的不同。

目前大多数大规模SF研究集中于北欧裔人群,全球人群代表性不足。缺乏多样性的基因组研究不仅影响基因组发现的转化、增加意义未明变异(VUS)的回报几率,还会导致遗传咨询体验和结果的不平等,限制基因组医学的普适性。马耳他群岛位于南地中海,人口约40万,具有独特的遗传特征,包括奠基者效应和与欧洲及中东人群的混合迹象。此外,马耳他人群肥胖和心血管代谢疾病患病率高,复杂性状的风险等位基因谱也有所不同。然而,该人群缺乏特异性基因组数据,基因组素养和精准医学的实施仍存在差距。

在此背景下,本研究旨在分析未针对临床疾病进行选择的马耳他参考队列中ACMG SF v3.2列表内可报告P/LP SFs的频率与谱系特征,并初步探索ACMG基因列表中P/LP变异的携带频率,为该人群的基因组医学提供流行病学数据。

2 材料与方法

2.1 伦理声明

本研究经马耳他大学机构伦理审查委员会批准(CMMB-2023-00004),研究方案遵循《赫尔辛基宣言》。所有参与者均提供了参与研究和基因分析的书面知情同意。

2.2 研究人群

为评估马耳他人群可报告SF的频率与谱系,本研究分析了两个全外显子组测序(WES)数据集。第一个数据集包含320名自报三代马耳他-高加索血统无关成年人的序列,作为马耳他人群选定基因组研究的参考对照队列。所有样本在测序和分析前均进行了伪匿名化处理,未保留可识别信息。由于参与者未同意重新联系、返还遗传结果或链接健康记录,该数据集仅作为种族匹配队列用于估计人群水平等位基因频率和解释病例队列的遗传发现。

第二个队列包含来自马耳他国家人群生物样本库DwarnaBio试点分析的30个WES序列。DwarnaBio旨在提供集中的、基于人群的生物样本和相关临床数据存储库,允许重新联系、多组学研究和纵向随访。它通过在线平台(dwarna.mt)运行动态同意系统,优先考虑参与者参与以培养信任和公众对研究的参与。DwarnaBio遵循国际生物样本库标准,促进在其作为成员的BBMRI-ERIC网络内的互操作性和数据共享。

汇总分析(n=350)中,参与者年龄在18至57岁之间,性别分布均衡(48%为女性)。招募旨在捕捉表观健康普通成年人群的横截面,未针对任何特定疾病表型进行选择。所有个体在招募时均进行了临床特征评估。排除标准包括已知遗传诊断或综合征、近亲婚配史或密切家庭关系。智力障碍、发育迟缓或无法提供知情同意的个体也被排除。重要的是,本分析未包含任何已知遗传诊断或综合征条件的参与者,以防止 ascertainment bias,确保队列反映未选择人群的基础SF流行率。

2.3 外显子组测序、数据处理与生物信息学分析

从K2-EDTA抗凝外周血白细胞中提取基因组DNA。使用SureSelect Human All Exon V8捕获设计(Agilent Technologies)制备WES文库,靶向RefSeq、CCDS和GENCODE定义的蛋白质编码区。文库在NovaSeq6000测序仪(Illumina Inc.)上进行150 bp双端测序。

测序数据使用标准化流程分析:FASTQ文件经质量评估后,比对至人类参考基因组(GRCh37)。使用GATK进行 indel 重校准、碱基质量重校准和SNV/InDel calling。变异注释使用ANNOVAR。测序质量指标如下:Q30分数为94.77%,平均比对效率约98.79%,目标区域平均深度约78.90×。中位95.3%的目标碱基测序深度≥20×,满足临床级杂合变异检测推荐的≥90%阈值。

变异分析限于ACMG SF v3.2列表中的所有81个基因。保留影响蛋白质编码区的变异(错义、无义、移码、非移码indel或剪接位点/区域变异),排除位于非编码UTR或深度内含子区域(>±10 bp from exon boundaries)的变异。应用VQSR阈值保留高质量变异调用进行下游分析。注释限于MANE Select (v1.4)定义的规范转录本。使用Franklin (v.80)变异解读平台(Genoox, Tel Aviv, Israel)根据ACMG/AMP指南进行致病性分类。预测功能丧失(PVS1)变异和错义变异的计算证据(PP3/BP4)遵循专家建议。等位基因频率源自GnomAD v4.1.0。仅保留分类为P/LP的变异,排除意义未明变异。对候选变异进行额外注释,包括交叉引用ClinVar条目(ClinVar Release 2025-01)并整合计算机致病性预测和保守性评分(CADD, EVE, ESM-1b, AlphaMissense)。

3 结果

3.1 主要发现:可报告次要发现的流行率与谱系

在350名个体中,12人(3.4%)在9个常染色体显性(AD)基因中携带P/LP medically actionable变异。未发现常染色体隐性(AR)基因中的双等位基因变异或X连锁P/LP变异的半合子、杂合子或纯合子个体。

按疾病类别分类:

  • 7名个体在5个遗传性心脏病相关基因中携带P/LP变异。

  • 3名个体在癌症相关基因中携带变异。

  • 2名个体携带RYR1的P/LP变异(杂项表型)。

  • 未发现先天性代谢错误相关基因的P/LP变异。

3.2 心血管疾病相关变异

在心血管疾病类别中,两名个体杂合携带DES p.Arg350Trp致病变异(与扩张型心肌病DCM相关)。一名个体杂合携带MYBPC3 p.Gly531Arg致病变异(与肥厚型心肌病HCM相关)。两名个体杂合携带KCNQ1 p.Arg397Trp(LP)变异(与长QT综合征LQTS相关)。一名个体杂合携带TGFBR2 p.Pro129fs(LP)变异(与Loeys-Dietz综合征相关),另一名个体检测到与马凡综合征相关的LP变异(FBN1 p.Arg165Gln)。ACMG列表中的两个X连锁基因未发现P/LP变异。

3.3 癌症相关变异

在癌症相关位点中,观察到3种独特的杂合P/LP变异:

  • BRCA2 p.Trp1692fs(P),与遗传性乳腺癌和卵巢癌相关。

  • MSH2 p.Leu341Val(LP),与林奇综合征相关。

  • 新型PTEN p.Ile50Ter(LP),与Cowden综合征和胶质瘤易感性相关。

3.4 RYR1及其他发现

两名个体在RYR1 (NM_000540.3)中携带 medically actionable变异:一名杂合携带致病变异p.Arg530His,另一名杂合携带LP变异p.Asp3501Tyr。

此外,还发现5名个体携带APC p.Ile1307Lys变异,这是一种主要在德系犹太人群中观察到的低外显率风险等位基因,与该人群结直肠癌风险适度增加相关。该变异携带者不表现出家族性腺瘤性息肉病(FAP)的临床特征,区别于更高外显率的APC变异。当前证据不支持将其纳入其他人群的可行动筛查面板。

3.5 常染色体隐性基因的携带者频率

除了显性疾病等位基因,还发现21名个体(6%)在4个AR可行动基因中携带高风险疾病等位基因。在MUTYH(14名个体)和ATP7B(5名个体)中鉴定出P/LP变异,当以复合杂合或纯合状态存在时,分别导致MUTYH相关息肉病和Wilson病。还检测到与庞贝病相关的GAA单等位基因P/LP变异,以及与遗传性血色素沉着症相关的HFE p.Cys282Tyr变异。

3.6 数据可视化

图1以图形形式总结了主要发现:(a) ACMG SF v3.2基因中识别的致病性/可能致病性(P/LP)变异的分布和分类。环形图显示每个变异类别个体的总体比例:3.4%携带常染色体显性(AD)基因的P/LP变异,6.0%是常染色体隐性(AR)基因P/LP变异的单等位基因携带者,1.4%携带低风险APC:p.Ile1307Lys变异。(b) 按基因类别和临床分类的AD基因中P/LP变异分布。(c) 按基因和临床分类的AR基因中单等位基因P/LP变异分布。条形图表示携带可能致病性或致病性变异的个体数量。

4 讨论

4.1 人群遗传学背景下的解读

本研究首次基于人群规模数据集确定了马耳他人群可行动致病性SF的频率和谱系。应用ACMG SF v3.2的81个基因列表,我们在3.4%的参与者中鉴定出P/LP变异,该频率与卡塔尔(3.5%)和东亚队列(3.4%)的估计值一致,但高于欧洲(2.8%)、黎巴嫩(2.1%)和台湾(1.8%)人群的报告。

当代马耳他人的遗传遗产源自殖民、贸易或定居于群岛的各种人群。马耳他的集体遗传特征支持其作为一个遗传隔离群,与欧洲大陆平均水平存在遗传结构差异,该人群中经常描述遗传奠基者。尽管多项大规模研究基于欧洲和北美血统队列估计了SF的流行率,但某些人口群体在全球基因组研究中仍然代表性不足。特别是,与马耳他有历史联系的阿拉伯基因组(如阿尔及利亚和利比亚)的代表性不足具有相关性。虽然卡塔尔生物样本库数据的加入是一个巨大进步,但它并不能代表北非和黎凡特国家。发展和扩展人群特异性数据集以推进精准医学的日益增长的需求,凸显了解决这一关键空白的必要性。基因组研究中缺乏多样性也阻碍了基因组医学项目的最佳发展, perpetuates inequities,并与诊断挑战相关。

4.2 研究间差异与分子谱系的临床意义

尽管多项研究报告了不同人群中SF的频率,但显示出显著变异性,估计值从0.59%到高达17%不等。这种变异性可归因于队列特征的差异,研究设计从基于健康成年人到特定患者群体不等。此外,测序方法、变异过滤流程和分析基因panel组成的差异也相关。这些方法学的不一致已被系统综述,并且在协调全球SF数据方面仍然是一个挑战。

除了总体频率,所识别变异的分子谱系具有临床意义。本研究识别出携带与遗传性乳腺癌和卵巢癌、结直肠癌、心肌病、心律失常和主动脉病相关的可行动有害变异的个体。这些发现的临床意义重大。识别携带 medically actionable变异的个体能够实现早期监测和可能的预防性治疗, potentially mitigating严重健康结果的风险。例如,携带心脏病相关变异的个体可能受益于定期心血管监测和预防措施,而携带癌症易感变异的个体可以进行更频繁的筛查并采取生活方式改变以降低风险。队列中 recurrent variants 的识别可能表明存在人群特异性奠基者等位基因,值得通过单倍型分析和分离研究进行进一步调查。

4.3 公共卫生影响与政策考量

SF在人群水平的公共卫生影响是无可争议的,因此将其整合到卫生政策中需要 evidence-based frameworks,以平衡临床效用、伦理保障和公平实施。政策框架应优先考虑分层或动态同意模型,以赋予研究参与者权力并最小化决策负担。在披露前,必须通过认可实验室对研究识别的变异进行强制性临床级验证,以减轻假阳性。政策应保证普遍获得遗传咨询,以减少解读差异,并 enable the development of region-specific SF lists and screening,特别是对于代表性不足的群体。未能通过资源分配和提供者教育解决这些支柱问题,有可能破坏对基因组医学的信任并加剧医疗保健差距。

然而,SF的识别给个人及其家庭带来了心理挑战。披露 medically actionable变异可能导致情绪困扰、产生脆弱感,并在患者及其家庭中施加决策冲突。为此,ACMG现在支持为患者提供选择不接收SF的选择,承认接收基因组风险信息的复杂个人、家庭和社会影响。因此,遗传咨询至关重要,不仅是为了解读SF的临床意义,也是为了为受影响个体提供必要的支持和指导,以应对潜在的情感和心理影响。

4.4 研究局限性与未来方向

一些局限性值得考虑。除了受试者数量有限外,研究设计排除了表型关联、家系内的分离研究,因此无法探索和完善基因型-表型关联。可行动SF最终将返还给在同意过程中明确选择接收此类结果的DwarnaBio生物样本库参与者。在披露之前,变异将在临床认可实验室进行独立验证,随后根据DwarnaBio的治理框架和返还基因组结果的标准操作程序进行遗传咨询。

此外,外显子组测序固有地省略了调节剪接活动的深度内含子变异和启动子变异,无法捕获复杂的结构变异,如倒位或大片段缺失/重复。此外,所使用的便利抽样和缺乏分层随机化方法可能会引入抽样偏差,限制这些发现的普适性。与其他人群生物样本库一样,我们的数据集可能反映了一种“健康志愿者”偏差,与全国代表性数据源相比,其社会人口统计学、身体、生活方式和健康特征有所不同。虽然来自两个来源的数据 collectively representative,但仍可能反映 ascertainment approaches and recruitment strategies 的潜在差异。尽管所有样本都使用相同的测序方法和变异解读流程进行处理,但不能排除批次效应或队列特征的细微差异。在解释汇总变异频率时应考虑这些因素,并且在未来扩展的数据集中可能需要进行敏感性分析。

大多数SF流行率研究共享额外的注意事项。本研究报告的频率估计反映了携带P/LP变异的个体比例,而非归因于这些变异的疾病病例比例。这需要访问基因分型的临床集合,并且对于表征可能在特定人群中富集的潜在奠基者变异具有重要意义。重要的是,本研究无法推断变异外显率,因为假定的致病变异经常在无症状个体中发现。单基因疾病变异的真实流行率和外显率通常未知,因为临床队列中存在 ascertainment bias。例如,研究表明,单基因糖尿病基因HNF1A中的致病变异在临床未选择个体中的外显率显著低于临床转诊先证者。这表明,有害变异的临床解读可能需要根据识别致病性单基因变异的具体背景进行情境化。

考虑到基因组医学的范式转变,包括外显子组测序作为一线诊断测试的日益普及以及新生儿基因组测序计划的新兴影响,此类考虑 increasingly pertinent。此外,在诸如家族性高胆固醇血症、遗传性乳腺癌和卵巢癌以及林奇综合征等疾病中,单基因风险受到个体多基因背景的调节。事实上,仅多基因风险在某些情况下就能带来与外显单基因突变 equivalent 的疾病风险。

5 结论

本研究首次提供了马耳他人群 medically actionable SFs 的基于人群的估计。我们的结果强调了在基因组研究中纳入代表性不足人群的重要性,并为精准医学计划的公平实施贡献了数据。未来的研究应侧重于将发现与临床数据整合、扩大队列规模以及制定区域特异性的变异解读和结果返还策略。我们的发现强调需要建立机制,将临床可行动结果 ethically返还给生物样本库参与者,并辅以获得遗传咨询服务以支持知情决策。此外,将此类基因组见解整合到国家精准医学框架中对于小规模或隔离人群尤其相关,其中定制的变异解读流程和区域特异性筛查指南可以增强基因组医疗服务的临床效用和公平性。

Author Contributions

研究概念化与设计:N.P.P.和D.M.;数据整理与分析:N.P.P.和L.G.;撰写、审阅与编辑:D.M., C.A.G, J.S., 和 L.G.;监督:N.P.P.和D.M.。

Acknowledgements

本研究得到马耳他大学机构资金支持。资助方未参与研究设计、数据收集、分析和解读,或本手稿的撰写。

Conflicts of Interest

作者声明无利益冲突。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号