突破极限:平衡打分函数质与量,助力超大规模虚拟筛选

【字体: 时间:2025年05月12日 来源:Future Generation Computer Systems 6.2

编辑推荐:

  在药物研发中,虚拟筛选至关重要,其关键在于分子对接和打分。研究人员针对 X - SCORE 和 DrugScore 这两个打分函数开展优化与近似技术研究。结果显示能提升筛选效率,在超大规模虚拟筛选中平衡精度与通量意义重大。

  在药物研发的漫长旅程中,寻找具有治疗效果的分子犹如大海捞针。药物发现所涉及的化学空间极为庞大,据估计包含 1033 个分子 ,但真正能成为有效药物的却寥寥无几。传统的药物筛选方式犹如在黑暗中摸索,成功概率极低。而虚拟筛选(Virtual Screening)作为药物发现的重要前期步骤,旨在通过计算机模拟来评估分子的潜力,就像是给科研人员提供了一个 “导航仪”,帮助他们在庞大的分子库中找到最有希望的 “宝藏”。
然而,虚拟筛选也面临着诸多挑战。其中,分子对接(Molecular Docking)和打分(Scoring)是两个关键问题。在虚拟筛选过程中,需要计算分子与蛋白质之间的相互作用强度,而这一过程不仅要考虑准确性,还要考虑计算时间。目前,大多数研究在比较打分函数时,往往只关注其准确性,却忽视了执行时间。在超大规模虚拟筛选中,如果不能有效降低单个分子的计算时间,即使利用大规模计算设施,也难以在可行时间内完成筛选。这就好比在一场限时比赛中,速度和准确性同样重要,缺一不可。

为了解决这些问题,研究人员开展了针对打分函数的优化和近似技术研究。他们对 X - SCORE 和 DrugScore 这两个知名打分函数进行了深入探究,这两个打分函数分别代表了经验和基于知识的打分方法。研究人员希望通过优化,在保证一定筛选准确性的同时,提高筛选通量,找到两者之间的最佳平衡。

研究人员采用了多种技术方法。在优化 X - SCORE 时,运用了量化(Quantization)和记忆化(Memoization)技术。量化通过对蛋白质进行体素表示来离散连续空间,近似原子位置;记忆化则用于预计算打分函数项的值,减少运行时计算量。对于 DrugScore,研究人员将其原始的出现值模型转换为潜在值模型进行预计算,还引入了 XGBoost 算法来提高预测准确性。此外,研究人员将优化后的算法移植到 CUDA 平台,利用 GPU 的强大计算能力加速计算。

研究结果如下:

  • X - SCORE 优化效果:通过量化和记忆化技术对 X - SCORE 进行优化。量化实验中,研究不同网格间距和半径范围对 X - SCORE 值的相对误差影响,发现较小的网格间距和更多的半径范围能降低误差,但会增加计算和存储成本,最终确定 0.5 ? 的网格间距和 5 个半径范围为最佳折衷。记忆化实验表明,优化后的 X - SCORE 性能略低于原始版本,但其富集因子仍与原始版本相当。在速度方面,优化后的 X - SCORE 在 CPU 和 GPU 上都实现了显著加速,CUDA 版本平均加速比达到 3433 倍 。
  • DrugScore 优化效果:DrugScore 通过预计算潜在值,显著提高了计算效率,加速比达到 2.7 倍 。引入 XGBoost 后,DrugScore 的预测准确性大幅提升,富集因子从 2.61 提高到 4.81 。同时,将 DrugScore 移植到 CUDA 平台后,速度提升约 34 倍 。
  • 大规模模拟影响:在大规模虚拟筛选模拟实验中,研究人员发现 X - SCORE 的近似版本虽然精度略有下降,但由于通量大幅提高,在有限时间预算下,其富集因子反而有所提升;DrugScore 的 XGBoost 增强版本虽然在通量上有小幅度的牺牲,但准确性的提高使其在大规模筛选中更具优势。这表明在大规模虚拟筛选中,平衡通量和准确性对提高整体性能至关重要。

研究结论和讨论部分指出,虚拟筛选的关键在于区分活性和非活性配体的能力,而执行时间在超大规模虚拟筛选中同样关键。研究人员提出的优化和近似技术,在提高工具性能的同时,仅带来了筛选能力的轻微下降。这些技术与 GPU 兼容,在 CUDA 平台上运行效果良好。对于 X - SCORE,能实现一个数量级的加速,筛选能力损失约 10%;DrugScore 的 CPU 版本性能几乎提升两倍。此外,研究还发现可以利用节省的时间引入机器学习步骤(如 XGBoost)来提高准确性,且实验结果表明这一做法能显著提升精度。该研究为超大规模虚拟筛选提供了重要的方法和思路,其方法可扩展到其他经验和基于知识的打分函数,在药物研发领域具有重要的应用价值。研究成果发表在《Future Generation Computer Systems》上,为相关领域的研究提供了新的方向和参考。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号