编辑推荐:
人工智能(AI)可变革药物研发,本文综述其在靶点识别、药物发现等阶段的应用及局限。
引言
在药物研发领域,传统模式面临诸多困境,如成本高昂、耗时漫长且成功率低。平均而言,一种新药从研发到上市需 10 - 15 年,成本约 26 亿美元,且成功率不足 10% 。临床开发失败多与安全性和有效性相关,凸显优化临床前流程的迫切性。人工智能(AI)凭借强大的数据处理能力,为药物研发带来新契机,有望变革这一领域。
药物发现和早期临床开发的传统模式
传统癌症药物发现流程复杂,或从确定治疗靶点开始,或先选择具有抗增殖活性的化学实体。后者的临床前研究耗时久、成本高,需确定化合物结合靶点、作用机制及联合策略等。“组学” 技术的应用有助于发现新的可成药靶点,基于基因组分析指导的 “个性化模型” 比传统经验治疗更具临床优势。
在靶点识别与药物发现方面,全基因组分析结合功能研究助力发现新的致癌弱点,基因敲除和高通量筛选(HTS)等实验方法发挥重要作用,如 CRISPR - Cas9 技术。然而,并非所有蛋白质都可成药,成药蛋白需具备特定特征,如明确的结合位点、可及性和稳定性等,转录因子等部分蛋白因结构特点难以成药。新化学实体的发现依赖 HTS 技术筛选化合物库,并结合构效关系(SAR)研究优化化合物性质,此过程称为先导优化。
早期临床试验设计中,I 期试验主要评估新药安全性和最佳剂量,确定最大耐受剂量(MTD)和剂量限制毒性(DLT),常采用 3 + 3 等经典设计。但这些方法存在局限性,如耗时、未考虑患者异质性、对长期安全性数据收集不足等,影响后续临床开发设计。
人工智能在癌症研究中的应用
靶点识别中的 AI
AI 在靶点识别中优势显著,能分析海量复杂数据集,挖掘隐藏模式,预测潜在治疗靶点。通过整合多组学数据,可识别关键生物标志物和可成药靶点,如机器学习(ML)和深度学习(DL)算法可处理基因组、蛋白质组和转录组数据。AI 还擅长基于网络的方法,分析基因、蛋白质和通路的相互作用网络,确定疾病进展的关键节点。卷积神经网络(CNNs)、循环神经网络(RNNs)可预测药物 - 靶点相互作用,生成对抗网络(GANs)辅助设计新分子,强化学习(RL)模型探索未知化学空间。未来,单细胞和空间转录组分析结合 AI 技术,有望更精准地识别靶点,如利用 CNNs 自动识别空间转录组图像中的模式,关联基因表达数据。
药物发现中的 AI
在药物发现阶段,AI 在虚拟筛选和从头药物设计方面发挥重要作用。虚拟筛选是药物发现的关键步骤,基于结构的虚拟筛选(SBVS)利用靶点 3D 结构预测化合物结合情况,传统方法存在局限性。ML 模型用于基于配体的虚拟筛选(LBVS),结合定量构效关系(QSAR)探索新候选药物。近年来,深度学习推动了深度 QSAR 发展,可更高效筛选化合物库,结合其他虚拟筛选技术,提升筛选效果。基于 CNN 的评分函数在虚拟筛选中逐渐兴起,能处理大量数据,识别化学结构与生物靶点结合的模式。
从头药物设计是 AI 在药物发现中的重要应用,可创造全新分子结构。RL 和生成模型如 GANs、变分自编码器(VAEs)用于设计新化合物,但新分子可能存在稳定性、可合成性和生物活性等问题。
先导优化中的 AI
先导优化阶段,AI 助力提升药物性质。AI 增强分子动力学(MD)模拟,更准确预测分子在生理环境中的行为,加速模拟进程。AI 模型可预测药物 - 药物相互作用和毒性,分析分子结构和生物通路,识别潜在毒性化合物,减少临床试验中因毒性导致的失败。多模态模型和 QSAR 结合,整合多种数据预测化合物生物活性,AI - 驱动的 QSAR 模型利用多种 ML 算法提升预测准确性,如随机森林、支持向量机(SVMs)和神经网络等,深度神经网络(DNNs)可自动学习分子特征,基于图的 QSAR 利用分子图结构信息增强预测能力。例如,PaccMann 框架整合多种数据预测癌细胞对化合物的敏感性,PaccMann^RL 通过强化学习生成个性化抗癌化合物。
精准医学和早期临床开发中的 AI
AI 在精准医学和早期临床开发中应用广泛。通过分析基因组、蛋白质组和临床数据,AI 可识别与药物反应或耐药相关的生物标志物,预测患者对药物的反应,推动个性化治疗策略发展。在早期药物开发中,AI 用于患者招募和试验地点选择,评估电子健康记录(EHRs)快速筛选合适患者;进行试验结果预测建模,模拟不同试验设计,减少试验失败;优化试验方案,调整剂量、治疗时长和患者特征等变量;实现自适应试验设计,根据试验数据实时调整方案,支持分散式临床试验(DCTs);利用真实世界数据(RWD)和历史试验数据创建合成对照臂(SCAs),解决传统试验的伦理、后勤和成本问题;创建数字双胞胎,在虚拟环境中测试治疗方案,降低风险、优化治疗策略。此外,可解释 AI 方法用于改善 I 期肿瘤临床试验的患者匹配,AI 还用于管理临床试验,提高效率。
AI 在早期药物发现和开发中的局限性
AI 在早期药物发现和开发中存在多方面局限。计算和数据质量方面,训练数据不具代表性或有限时,AI 模型会产生偏差,影响预测准确性,许多肿瘤临床试验数据存在偏差,合成数据(SD)可缓解但存在过拟合风险。AI 模型对输入数据敏感,低质量数据导致不可靠输出。伦理和监管方面,AI 驱动的药物发现涉及大量患者数据,存在隐私和数据保护问题,监管机构对药物安全性和有效性证据要求与 AI 的迭代、预测特性不匹配,影响 AI 成果在监管申报中的应用。数据质量方面,历史数据集可能不完整、不一致或缺乏代表性,整合多模态数据存在挑战,影响 AI 模型性能。
结论
AI 为药物研发带来诸多优势,在靶点识别、药物筛选、先导优化和早期临床试验等方面发挥重要作用,推动精准医学发展,提高癌症治疗成功率。然而,AI 无法解决临床前模型不精准等问题,部分药物在简单模型有效但在人体复杂系统中失败。将 AI 与现有药物研发模型整合面临挑战,需多学科团队协作。但随着技术发展和应用深入,AI 有望逐步克服局限,加速药物研发进程,为患者带来更多有效治疗方案。