编辑推荐:
为评估深度学习模型 AlphaMissense(AM)性能,研究人员开展相关研究,发现其与 ClinVar 存在显著差异。
在遗传检测领域,其对于罕见孟德尔疾病的诊断和管理至关重要。不过,当前全基因组和外显子测序(WGS 和 WES)对罕见孟德尔疾病的诊断率仍低于 25%。在众多的遗传变异中,错义变异(missense variants)的解读颇具挑战,大量错义变异被归类为意义不明的变异(VUS)。为了应对这一难题,许多研究人员将目光投向人工智能(AI),深度学习作为 AI 的重要分支,在生物医学领域展现出一定潜力,但在预测变异致病性方面仍存在不足。
在此背景下,来自波士顿儿童医院、哈佛医学院等机构的研究人员开展了一项研究,旨在评估深度学习模型 AlphaMissense(AM)在识别罕见病队列中具有临床意义的致病性和可能致病性错义变异方面的性能和效用。该研究成果发表在《npj Genomic Medicine》杂志上。
研究人员用到的主要关键技术方法如下:
- 样本队列:分析了 7454 名个体的队列,其中包括 3383 名被诊断患有各种罕见病的个体及其家庭成员,涵盖癫痫、炎症性肠病(IBD)等多种疾病5。
- 测序与注释:对样本进行全外显子测序(WES),使用 Ensembl Variant Effect Predictor(VEP)对变异进行注释,获取功能后果、变异等位基因频率等信息,并从多个数据库提取临床意义等数据8。
- 致病性评分:从 AlphaMissense、ESM1b、REVEL 和 BayesDel 等获取致病性评分,还利用 MaxEntScan 和 SpliceAI 评估变异对剪接位点的影响910。
研究结果如下:
- AM 与 ClinVar 对比评估:研究人员将 AM 对罕见病队列中错义变异的分类与 ClinVar 的专家策划数据进行比较,评估其精度和召回率。AM 在识别 ClinVar 中致病性(ClinVar_P)和可能致病性(ClinVar_LP)变异方面,精度为 32.9%,召回率为 57.6%。研究还对比了 AM 与其他深度学习方法(如 ESM1b、EVE)以及非深度学习方法(REVEL、BayesDel)的性能,发现不同方法在基因覆盖范围和变异分类性能上存在差异12。
- AM 在 IBD 队列中的应用评估:在炎症性肠病(IBD)队列中,研究人员优先考虑了功能丧失(LoF)变异、ClinVar_P 或_LP 变异以及 AM 预测的可能致病性(AM_LP)变异。研究发现,在 750 名 IBD 患者中,部分患者携带 AM_LP 变异,这些变异的致病性需进一步功能研究确认。同时,一些 ClinVar_P/LP 变异在 AM 中的评分未达阈值,不同算法在预测 IBD 相关基因变异致病性时表现各异34。
- AM 在蛋白质无序区域(IDRs)的性能评估:研究人员发现,AM 在评估蛋白质无序区域(IDRs)的致病性时存在困难,导致包含 IDRs 的基因的基因水平必要性评分不可靠。AM 的致病性评分与 AlphaFold2 的预测结构相关,在 AlphaFold2 预测置信度低的区域,AM 致病性评分较低,与 ClinVar 的分类差异更大67。
研究结论和讨论部分表明,深度学习模型虽然在生物医学领域表现出色,但在临床应用前需充分评估。该研究中,AM 与 ClinVar 的致病性预测存在显著差异,尤其是在 IDRs 和内在无序蛋白(IDPs)相关变异方面。临床遗传学更注重精度,而计算算法常优先考虑召回率,这导致在识别罕见病基因变异时出现较多假阳性。深度学习模型的微调需考虑个体基因组中致病性和良性变异的预期比例,并纳入表型信息。此外,该研究存在局限性,如部分聚焦于单中心疾病队列,仅依赖 ClinVar 评估变异临床意义。未来,将深度学习算法整合到临床遗传学工作流程中时,需仔细评估假阳性和假阴性结果的可能性,综合表型和基因型数据的全面研究对推进预测算法发展至关重要。这一研究为后续改进深度学习模型在遗传变异致病性预测方面的应用提供了重要参考,有助于推动精准医学在罕见病诊断和治疗领域的发展 。