DTreePred:基于机器学习的基因组变异致病性预测在线利器,推动精准医学发展

【字体: 时间:2025年04月10日 来源:BMC Bioinformatics 2.9

编辑推荐:

  在精准医学中,识别测序过程中的致病突变面临挑战,不同工具对致病性判断存在分歧。研究人员开展了 DTreePred 相关研究,它整合多种算法和数据库预测核苷酸变异致病性,在测试中准确性高,有助于提高医学诊断和治疗精度。

  在精准医学蓬勃发展的当下,遗传检测已广泛应用于医疗领域,能辅助诊断、监测、预防和治疗多种疾病,尤其是癌症。然而,一个典型肿瘤往往存在数千个突变,其遗传异质性使得明确这些突变的性质极具挑战。目前,识别单核苷酸变异(SNV)致病性的可靠方法至关重要,它有助于研究代表性不足的人群,为遗传咨询和精准医学提供支持。但现有的众多预测工具和数据库却存在分歧,例如不同工具对某些与恶性高热相关的核苷酸变异致病性分类不同,这给临床决策带来极大困扰。为解决这些问题,巴西里约热内卢州联邦大学数字都会研究所生物信息学研究生课程等机构的研究人员开展了相关研究。他们开发了 DTreePred 这一跨平台移动应用程序,这是一款基于机器学习评估核苷酸变异致病性的在线可视化工具。该研究成果发表在《BMC Bioinformatics》上,为精准医学的发展带来了新的突破。
研究人员主要运用了以下关键技术方法:从 ClinVar、dbNSFP 等数据库获取数据;使用决策树算法,结合等位基因频率数据和 21 种经典预测工具结果进行致病性分类;利用 Scikit-learn 框架和 Python 语言训练 15 种机器学习算法构建模型。此外,研究还涉及对巴西里约热内卢州人群队列的样本分析。

下面介绍研究结果:

  • DTreePred 的开发与实现:DTreePred 整合了决策树算法、15 种机器学习分类器以及经典预测工具。通过从多个数据库获取数据,包括 ClinVar、dbNSFP 等,实现对核苷酸变异的注释和分析。它利用这些数据进行元预测,最终给出变异致病性分类结果。
  • 功能及优势对比:DTreePred 具有多种功能,如展示经典预测结果、基于机器学习算法进行预测、提供决策指导等。与其他在线变异可视化系统相比,它还具备存储用户查询、支持移动设备等优势。在功能对比中,充分展现了其在处理复杂变异数据方面的独特价值。
  • 性能评估:研究人员使用来自 ClinVar 数据库的 200 个已知致病性的核苷酸变异,以及来自莱顿开放变异数据库(LOVD)和深度突变扫描(DMS)实验的数据集对 DTreePred 进行测试。结果显示,DTreePred 在识别致病性和中性变异方面表现出色,准确性高于其他预测模型,如在 DMS 数据集上准确率达到 96.95% 。
  • 案例研究:在对巴西东北部 13 名年轻胃癌患者的研究中,DTreePred 对先前遗传检测为阴性的患者的变异进行重新分类。研究发现,超过 95% 的癌基因和抑癌基因变异在 ClinVar 数据库中分类不明确,但 DTreePred 成功将这些变异分类为中性或致病性。此外,研究还发现癌基因和抑癌基因中致病性变异的数量与患者的总生存期相关。

在结论和讨论部分,DTreePred 的优势得以凸显。它通过整合多种数据和预测方法,为评估变异致病性提供了强大的工具,在准确性和可靠性方面超越了其他预测模型。其用户友好的界面和移动响应性,使其能够很好地融入临床工作流程,为临床决策提供有力支持。尤其对于代表性不足的人群,DTreePred 有助于填补变异解释的空白,推动精准医学的公平发展。不过,该工具仍有提升空间,未来可进一步拓展分析调控区域变异、支持更多基因组版本等,以更好地适应人类遗传学的复杂性,助力研究和临床实践的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号