基因组平台特异性多基因风险评分对乳腺癌风险分层的影响:一项技术比较研究

《Communications Medicine》:Genomic platform specific polygenic risk scores impact breast cancer risk stratification

【字体: 时间:2025年12月13日 来源:Communications Medicine 6.3

编辑推荐:

  本研究针对不同基因分型平台在临床多基因风险评分(PRS)应用中缺乏标准的问题,系统评估了五种基因组平台(包括三种Illumina芯片、一种ThermoFisher定制芯片和低覆盖度全基因组测序)对乳腺癌313变异PRS(PRS313)风险分层的影响。研究发现平台间存在系统性差异,特别是在插入/缺失(indel)检测一致性方面,导致高风险个体分类存在显著差异(4-45% vs 校正后15-21%)。均值校正可改善一致性,但仅7/92个体在所有平台均被归类为高风险。该研究强调了平台选择对临床PRS实施的重要性,为标准化校准提供了关键依据。

  
在精准医疗时代,多基因风险评分(Polygenic Risk Score, PRS)正逐步成为疾病风险评估的重要工具。特别是对于乳腺癌这种常见恶性肿瘤,基于313个遗传变异位点的PRS313模型已在多项研究中展现出对疾病风险的预测能力,并开始应用于基于风险的乳腺癌筛查项目,如PERSPECTIVE I&I研究和BREATHE研究。然而,将PRS从研究工具转化为临床实践仍面临诸多挑战,其中一个常被忽视但至关重要的问题是:不同的基因检测平台是否会对风险评分产生系统性影响,从而改变个体的风险分类?
目前,临床实践中缺乏统一的PRS检测平台标准。研究人员和临床医生可能根据成本、通量或技术偏好选择不同的基因分型芯片或测序平台,但这些平台在探针设计、检测原理和数据分析流程上存在差异。更复杂的是,PRS313模型中包含48个插入/缺失(indel)变异,这类变异在不同平台上的检测一致性通常比单核苷酸变异(SNV)更差。如果平台间的技术差异导致风险评分的不一致,特别是对于接近临床决策阈值的个体,可能会影响筛查策略的制定和预防措施的实施。
为了解决这一问题,由新加坡基因组研究所李静梅(Jingmei Li)教授领导的研究团队开展了一项深入的技术比较研究,系统评估了五种主流基因组平台在乳腺癌PRS313风险分层中的一致性问题。该研究近期发表在《Communications Medicine》杂志上。
研究人员采用了几项关键技术方法:他们收集了92名亚洲志愿者的唾液样本,涵盖华裔、马来裔和印度裔人群;使用五种平台进行基因分型,包括三种Illumina芯片(GSA、OncoArray、GDA)、一种ThermoFisher定制芯片(Axiom_PrecipV1)和低覆盖度全基因组测序(lc-WGS);通过桑格测序验证indel变异;利用1000 Genomes项目参考面板进行基因型填充;采用PRS313标准算法计算风险评分;使用Fleiss's Kappa统计量评估平台间一致性。
研究结果
直接分型变异
研究发现,商业芯片对PRS313变异覆盖不足:GSA、OncoArray和GDA分别仅覆盖20%、32%和26%的PRS313变异,且全部为SNV。定制ThermoFisher芯片成功设计了259个变异(83%),包括24个indel。平台间共有的变异仅占全部检测变异的1%(28,646/2,734,610),凸显了基因填充在PRS计算中的必要性。
细胞系中的PRS313
在细胞系中,lc-WGS表现出最佳重现性,四次重复测量得到完全相同的PRS313值。ThermoFisher芯片(主要基于直接分型)的系统性评分低于其他平台,而不同芯片平台间的评分在包含所有填充变异时(rsq≥0)较为接近,但在限制高填充质量变异时出现差异。
indel的桑格测序验证
桑格测序验证揭示了indel检测的显著不一致性。在44个成功设计引物的indel中,17个(39%)在桑格测序中未观察到变异,导致无法计算一致性。平台间一致性Kappa值范围极广(0.007-1.000),7个lc-WGS填充的indel Kappa值低于0.5,表明indel检测是PRS313不一致的重要来源。
平台间变异一致性
在唾液样本中,85%(266/313)的PRS313变异在所有平台上可用。78%的变异显示几乎完美的一致性(Kappa>0.8),但15个SNV的一致性极低(Kappa≤0.2)。低次要等位基因频率(MAF)的变异倾向于具有较低的一致性,且低一致性变异分布于各种填充质量水平。
PRS313的平台间相关性
尽管平台间PRS313高度相关(r2:0.754-0.940),但同一个体在不同平台上的绝对评分存在差异。基于大量填充变异的平台(芯片和lc-WGS)倾向于高估PRS313。设计相似的芯片对(如GDA~GSA)显示较小的均值偏移(截距=-0.013)和接近1的斜率。
高风险分类受平台影响
未进行均值校正时,不同平台识别的高风险个体比例差异巨大(4%-45%)。均值校正后(将均值对齐至参考人群的0.130),这一范围缩小至15%-21%,更接近预期的20%。然而,高风险个体的识别仍不一致:26名(28%)个体在至少一个平台上被归类为高风险,但仅有7名(8%)在所有五个平台上一致被归类为高风险。接近阈值(80百分位±5百分位)的个体分类一致性最低(56%),而远离阈值的个体一致性较高(<75百分位:92%;≥85百分位:82%)。
排除indel的亚组分析
排除indel后,高风险个体比例降低(13%-18%),所有芯片间的一致性改善(Kappa从0.668升至0.708),但Illumina芯片间的一致性反而下降(Kappa从0.739降至0.697),表明indel对不同平台的影响不同。
限制使用平台共有变异的分析
当PRS313计算仅限于所有平台共有的变异时,高风险个体的识别一致性提高:24名个体在至少一个平台上高风险,其中11名(46%)在所有平台上一致,高于变异数量不固定时的27%。Illumina芯片间的评分分布更为相似,与ThermoFisher存在系统性差异。
限制使用直接分型变异的分析
当仅使用45个在所有芯片上直接分型的变异计算PRS45时,平台间几乎完美一致(Kappa=0.847),表明填充过程是差异的主要来源,而非直接分型本身。
限制华裔女性的分析
在华裔女性亚组中,平台特异性偏移模式与全样本相似,但由于样本量小,无法量化相关性变化,风险分类一致性也未提高。
研究结论与意义
本研究系统揭示了基因组平台选择对乳腺癌PRS313风险分层产生的实质性影响。尽管不同平台计算的PRS313高度相关,但绝对评分差异可能导致接近临床阈值个体的风险重分类。indel检测的不一致性、填充变异的质量和数量差异、以及平台特异性系统偏移是主要影响因素。
均值校正可改善一致性,但不能完全消除平台间差异。在理想情况下,PRS应在使用相同直接分型数据的参考人群和应用人群间计算,但实际中常依赖填充来增加变异覆盖度,这引入了额外变异性。
该研究的临床意义在于警示我们:PRS的临床实施需要充分考虑技术平台的选择和标准化。如同血压或HbA1c等临床指标,不同设备或检测方法间的微小差异可能导致患者跨越诊断阈值,进而影响治疗决策。对于接近高风险临界值的女性,平台选择可能改变其筛查策略和预防建议。
研究局限性包括使用1000 Genomes参考面板可能对亚洲人群不是最优选择,唾液DNA相较于血液DNA可能引入更多变异性,以及未能评估从样本处理到文库制备的全流程重现性。
总之,该研究强调了在技术、生物学和分析变异性背景下评估多基因风险评分的重要性。PRS313作为乳腺癌风险分层的有价值工具,其向临床实践的转化需要严格的验证、分析流程的协调化以及针对不同参考人群的持续校准。随着更多国家投资于人群基因组计划,确保不同平台和数据集间PRS的可比性将成为实现精准公共卫生的关键。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号