计算机预测工具在肿瘤基因 panel 变异策展中的性能评估

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《HUMAN MUTATION》：The Performance of In Silico Prediction Tools for Variant Curation in a Panel of Cancer Genes

【字体：大中小】 时间：2026年06月22日 来源：HUMAN MUTATION 3.7

编辑推荐：

　　罕见单碱基对改变是疾病的重要诱因，因其可位于基因关键区域，通过影响蛋白质构象（protein conformation）及蛋白质相互作用（protein-protein interactions）改变生物学功能。生成必要的实验证据以明确这些基因变异的结果耗时且

罕见单碱基对改变是疾病的重要诱因，因其可位于基因关键区域，通过影响蛋白质构象（protein conformation）及蛋白质相互作用（protein-protein interactions）改变生物学功能。生成必要的实验证据以明确这些基因变异的结果耗时且成本高昂。这些挑战促使大量计算机预测工具（in silico prediction tools）的发展。这些工具频繁使用相似的信息来源，并在重叠的多基因"真实"数据集上进行训练。然而，这些计算机工具在单个基因上的性能常缺乏定量验证。本研究中，研究人员将ClinGen序列变异解读工作组（ClinGen Sequence Variant Interpretation Working Group）推荐的计算机评分阈值和AlphaMissense预测应用于一组已确定致病性/良性（pathogenicity/benignity）的易感基因变异。在评估的基因中（BRCA1、BRCA2、TP53、TERT和ATM），当使用推荐阈值时，计算机工具预测对致病性TERT变异的敏感性（sensitivity）<65%较差，对良性TP53变异的敏感性≤81%较差。AlphaMissense对TP53的表现优于其他工具，但未能提高TERT变异的预测准确性。该验证研究强调，计算机工具性能具有基因特异性（gene-specific），且依赖于算法构建的"训练集"。当基于临床和功能证据已建立足够数量的良性和致病性错义变异时，计算机工具评分应在单个基因上进行验证。对于无法进行基因特异性验证而使用基因无关计算机评分截断值的情况，建议考虑错义变异-蛋白质结构影响关系。

**研究背景与问题**

错义变异的解读在肿瘤易感基因的临床诊断和研究中仍面临重大挑战。致病性变异可能极为罕见甚至为家族特有，导致病例富集难以建立。表型常呈晚发性、不完全外显且非特异性，使得分离分析（segregation analysis）效用有限。尽管功能基因组学检测可用于部分基因（如TP53、BRCA1、BRCA2和TERT）的致病性/良性评估，但许多基因缺乏功能检测手段，且检测开发成本高、劳动密集、通量低。美国医学遗传学与基因组学学会联合分子病理学协会（ACMG/AMP）的变异策展标准因大多数罕见错义变异无法满足标准而难以应用。计算机预测工具为辅助解读提供了可能，ACMG/AMP标准中的PP3和BP4准则即为此设立。然而，许多基因的特异性指南依赖于多基因"真实集"训练的算法阈值，部分基因甚至完全不使用计算机工具评分。

**研究设计与核心发现**

研究人员旨在评估基因无关推荐应用于单个基因时的性能，检验计算机工具REVEL、MutPred2、BayesDel（无等位基因频率）、VEST4和CADD的预测性能，以及蛋白质结构考量（MISCAST和AlphaMissense）能否提高预测准确性。研究发现，没有单一工具在所有五个基因中表现最优。总体而言，排除TERT后，PP3支持级截断值的中位敏感性为84%。TERT预测的敏感性最差，所有工具均<65%。在PP3中等强度截断值下，仅REVEL对TP53和BRCA2、BayesDel对TP53和BRCA1、MutPred2对TP53的敏感性>70%。PP3强证据级别的特异性虽高，但敏感性极差（多数<40%）。BP4结果偏向高特异性，但敏感性不足。AlphaMissense对BRCA1和BRCA2表现较好（敏感性>88%，特异性>96%），但对TP53良性变异的敏感性仅88%，对ATM和TERT表现较差。针对TERT的优化显示，调整VEST4截断值可改善性能，AlphaMissense的截断值调整也显著提高了预测准确性。MISCAST的P3DFi分数分析揭示，TERT在低P3DFi分数（<-1）时致病变异富集更明显，而TP53在-1至2分区间良性变异更富集，这可能解释了对TP53预测特异性差的原因。

**研究意义**

该研究发表于《HUMAN MUTATION》，强调了计算机预测工具性能的基因特异性，提示在应用PP3（多项计算证据支持有害效应）和BP4（多项计算证据支持良性变异）准则时，需考虑基因特异性验证的重要性。对于训练数据不足或机制特殊的基因（如TERT），基因无关截断值可能导致误判，应结合蛋白质结构影响关系进行考量。

**关键技术方法**

研究采用ClinGen序列变异解读工作组推荐的计算机评分阈值，纳入BRCA1、BRCA2、TP53、TERT和ATM五个基因的错义变异"真实集"进行验证。真实集来源包括：Fortuno等2018年的TP53数据集（TP53_1，247个致病/21个良性）、ClinGen证据库（第二个TP53数据集TP53_2、以及跨50基因的738个致病/361个良性变异）、BRCA1/BRCA2突变数据库（University of Utah，BRCA1：44个致病/267个良性；BRCA2：20个致病/286个良性）、LOVD3的ATM数据（40个致病/35个良性），以及TERT的三个数据集（TERT_1：32个致病/6个良性；TERT_2和TERT_3为扩展集）。使用bootLR R包进行贝叶斯统计分析计算阳性似然比（PLR），通过10000次bootstrap抽样估计95%置信区间。利用plotROC R包生成受试者工作特征（ROC）曲线比较工具性能，使用ggplot2可视化MISCAST的P3DFi分数分布。所有变异经dbNSFP v4.2数据库注释获取计算机预测分数，SpliceAI阈值≥0.2筛选剪接影响。

**研究结果**

**3.1 敏感性与特异性**

研究发现无单一工具适用于所有基因。PP3支持级截断值下，除TERT外中位敏感性为84%。TERT所有工具的敏感性均<65%。REVEL对BRCA1和ClinGen2、CADD对TP53和ClinGen2、VEST4对BRCA2、REVEL/BayesDel/MutPred2对ATM的敏感性<70%。PP3中等强度下仅REVEL（TP53、BRCA2）、BayesDel（TP53、BRCA1）、MutPred2（TP53）>70%。PP3强级别特异性极高但敏感性极差（<40%，BayesDel对TP53为57%除外）。特异性表现：PP3支持级中位91%，REVEL和BayesDel对TP53及TERT较差（67%-89%）；PP3中等强度多数>90%；PP3强级别2113个变异中假阳性仅7/2/2/1个（BayesDel/REVEL/MutPred2/VEST4）。BP4偏向高特异性，VEST4和CADD敏感性最高。

**3.2 PP3的PLR**

所有工具PP3支持级PLR除CADD（TP53_1）和全部TERT预测外均≥2.1。TERT虽无假阳性但敏感性差导致95%CI下限<2.1。除TERT外，MutPred2PP3支持级PLR均≥4.3（中等目标）。PP3中等强度较不一致：REVEL（TP53_1）PLR=3.7未达标；VEST4和REVEL对ATM接近目标；CADD仅BRCA1和BRCA2达标。PP3强级别虽PLR达标，但敏感性差导致TP53、BRCA1、BRCA2的95%CI下限<18.1。

**3.3 BP4的PLR**

BP4因敏感性不足而不稳定达标。除TERT外工具高度特异。VEST4表现最佳，除TERT外所有基因支持级和中等级均达标。CADD强级别仅BRCA1、BRCA2和ClinGen组有真阳性结果，但敏感性差致95%CI均<18.7。

**3.4 AlphaMissense预测**

通用截断值≥0.564对BRCA1和BRCA2致病性预测特异性>96%、敏感性>88%；良性预测特异性>90%、敏感性>91%。TP53良性敏感性88%（对比其他工具中位48%）。最高PLR 95%CI下限为BRCA1的22.2（达PP3强级别）。ATM和TERT表现较差，类似其他工具。

**3.5 TERT截断值优化**

TERT基因无关截断值性能欠佳。VEST4 AUC最高（0.86，主要由高特异性驱动）。将PP3支持级截断值下调至≥0.5，TERT_3和TERT_1敏感性分别提升至67%和59%，特异性0.9和1.0，PLR 95%CI下限2.5和1.4。BP4截断值上调至≤0.16，敏感性50%，特异性90%和97%，PLR 95%CI下限2.2和2.9。AlphaMissense类似调整（致病>0.40、良性<0.09）后PP3敏感性59%，BP4特异性100%。

**3.6 MISCAST预测与蛋白质结构影响关系**

MISCAST,\
MISCAST通过P3DFi分数分析蛋白质结构功能影响。BRCA1、BRCA2和ATM的P3DFi分数与MISCAST多基因数据集[24]的致病变异富集模式相似。但TERT在低P3DFi分数（<-1）时致病变异富集更明显，而TP53在-1至2分数区间良性变异更富集——这可能解释TP53的BP4敏感性差和PP3特异性差。

**讨论总结**

研究证实了计算机预测工具性能存在显著的基因特异性。高特异性以牺牲敏感性为代价的权衡在诊断策展中适当，但当敏感性过低时将导致PLR不达标。AlphaMissense对TP53的改善与近期评估一致，但基因无关截断值若应用于更强证据级别需更严格。TP53的特殊性在于其对错义变异的物理化学变化耐受性较高，DNA结合域内亦缺乏约束性。相对溶剂可及性（RSA）分析显示，TP53埋藏/部分埋藏变异的特异性差与结构不稳定性（ΔΔG）评分相关。TERT表现最差的原因包括：高度约束基因特性导致小物理化学变化即致病；表面暴露残基处的错义变异比例高（影响蛋白质-RNA-DNA相互作用），而此类变异在训练集中代表不足。characTERT数据显示AlphaMissense对暴露残基的敏感性仅25%（埋藏/部分埋藏为66%）。研究支持在数据充足时进行基因特异性验证，但需权衡多基因panel和全外显子组筛选中的工作流程复杂性。

**研究结论**

当前可用的计算机预测工具基于多基因混合的"真实集"训练。TERT等蛋白质的功能可能通过训练集中代表不足的机制受影响，如DNA或蛋白质相互作用受损/改变。研究结果强调，尤其在PP3/BP4应用于中等或强证据级别时，计算机工具使用的基因特异性验证至关重要。尽管计算机工具预测与高特异性相关，提高工具敏感性仍是未来需求方向。

联系信箱：

粤ICP备09063491号

热点排行