编辑推荐:
本文聚焦人工智能(AI)在 RNA - 配体相互作用预测领域的应用。阐述了 AI 在结合位点识别、结构建模、结合亲和力预测等方面的进展,分析了面临的挑战,探讨未来发展方向,对 RNA 靶向药物研发意义重大。
引言
自 20 世纪 40 年代发现链霉素和新霉素后,以小分子靶向 RNA 来发现新抗生素的研究备受关注。RNA 曾被认为只是遗传信息传递中的信使,如今因其在众多生物过程中发挥关键作用,已成为多面的治疗靶点34。它能折叠成层次结构,与多种配体相互作用,影响基因表达、RNA 加工和蛋白质合成5。这促使人们在抗病毒药物开发、癌症治疗和代谢途径调节等领域,积极探索将 RNA 作为新型治疗靶点6。
准确预测 RNA - 配体相互作用对药物发现和生物技术至关重要。它不仅有助于快速识别潜在药物候选物,优化先导化合物用于临床,还能深入了解 RNA - 配体复合物的结构和动态特性,以及配体调节 RNA 功能的分子机制78。高效的计算预测方法能助力筛选实验验证对象,优化药物研发流程,推动个性化医疗时代 RNA 靶向疗法的发展9。
过去,预测 RNA - 配体相互作用的计算方法主要有分子对接和分子动力学(MD)模拟11。分子对接可预测配体与 RNA 结合的优选取向,为研究结合位点和亲和力提供线索;MD 模拟则能探究复合物随时间的动态行为,揭示构象变化和复合物稳定性信息12。但这些方法流程繁琐、计算量大,难以捕捉生物系统的复杂性13。
近年来,AI 成为预测 RNA - 配体相互作用的变革性工具。机器学习(ML)尤其是深度学习(DL)的发展,革新了复杂生物数据集的分析方式14。AI 方法能挖掘复杂数据集中的相互作用模式,做出传统方法难以实现的预测,在高通量筛选中优势明显,还能探索非传统 RNA 靶点,拓宽潜在治疗干预范围151617。不过,由于 RNA 独特的结构和动态特性,精确模拟其与配体的相互作用仍颇具挑战。RNA 会形成复杂的高阶结构,如环、发夹和假结等二级和三级基序,这些结构依赖复杂的氢键网络和碱基堆积相互作用维持稳定,且对环境因素和配体相互作用极为敏感,导致 RNA 构象灵活多变2021。此外,经实验验证的 RNA - 配体复合物结构有限,制约了预测模型的发展。虽然有基准数据集(表 1),但其规模和范围仍不足。将 AI 与更丰富的实验数据集结合,有望突破这些难题,助力发现新型 RNA 靶向疗法,推动 RNA 药物研发进程22。
用于 AI 驱动的 RNA - 配体相互作用模型的数据库
AI 算法的主要目标是挖掘数据中的隐藏知识,善于发现不易察觉的潜在关系和模式。在 RNA - 配体相互作用研究中,AI 模型应用于五个关键领域(图 2):结合位点预测、复合物结构预测、结合模式预测、结合亲和力预测和虚拟筛选(VS)。接下来将总结用于这些预测的最新相关数据库。
结合位点识别
AI 融入 RNA - 配体结合位点预测,极大地推动了 RNA 靶向药物发现领域的发展。AI 驱动的方法利用多种框架,如 ML 集成算法和深度神经网络,来应对 RNA 结构复杂性和动态行为带来的挑战(表 2)。像 RNAsite38、RNACavityMiner*39、NABS40和 RNet 等模型,充分展示了结合复杂 ML 算法在该领域的有效性。
结构建模
AI 在解决 RNA - 配体复合物建模难题方面前景广阔。下面将总结 AI 在预测 RNA 三维结构、配体结合姿态,以及整合这些方法进行全面复合物建模的最新进展(表 3、表 4)。
结合亲和力预测和虚拟筛选
RNA 靶向疗法的发展依赖于准确高效地预测 RNA - 配体结合亲和力,这对虚拟筛选(VS)的有效性至关重要。近期 AI 驱动的模型采用多种技术提升预测效果(表 5)。
结论与展望
AI 在 RNA - 配体相互作用研究领域尚处于新兴阶段,但潜力巨大。该领域典型的 AI 流程是先对 RNA 和配体进行表征学习,提取分子特征,然后利用 AI 模型完成结构生成、结合位点识别、结合亲和力和模式预测以及虚拟筛选等任务(图 2)。
尽管取得了一定进展,但与蛋白质 - 配体相互作用预测相比,AI 在 RNA - 配体相互作用预测方面的整合仍不够成熟。未来,应着力将前沿 AI 技术与基于物理的模型相结合,同时扩大实验数据集规模,以提升 RNA - 配体相互作用预测的准确性,推动 RNA 靶向药物研发取得更多突破。