综述:医学生物学与AI药物发现之间的鸿沟
《Drug Discovery Today》:Gaps between medical biology and AI drug discovery
【字体:
大
中
小
】
时间:2025年10月26日
来源:Drug Discovery Today 7.5
编辑推荐:
本文系统分析了人工智能(AI)在药物发现领域与医学生物学现实之间的三大关键鸿沟:将结合亲和力与生物活性混为一谈、过度依赖简化生物活性指标(如EC50)、AI应用在药物发现流程中的碎片化。作者提出构建生物情境化AI框架,通过整合多尺度生物学数据(如条件-值曲线)和跨管道见解,推动AI从任务特异性工具向整体性解决方案转变,为弥合计算科学与生物复杂性之间的差距提供了实践指南。
Gap 1:AI模型中对结合亲和力与生物活性的误解
结合亲和力(Binding Affinity)与生物活性(Bioactivity)是药物发现中两个根本不同的概念,但当前许多AI驱动的方法却使用同一模型对两者进行预测。生物活性指的是物质在生命系统中诱导生物学效应的能力,而结合亲和力仅衡量分子与其靶标之间的相互作用强度。两者并非单调对应关系——高结合亲和力并不总能转化为预期的生物效应。更复杂的是,即使在同一测量类型中,实验方法(如SPR、ITC)和检测条件(如pH值、温度)的差异也会显著影响测定值。若将同一AI模型直接套用于不同语境,会引入显著偏差。
要使AI准确预测生物活性,需进行特异性设计:包括通过空间空性建模活性位点可及性、通过图神经网络(GNN)和分子对接模拟多种分子相互作用,以及通过机制方程(如Cheng–Prusoff方程、Hill方程)整合检测条件。缺乏这些生物学语境的设计,AI模型只会被简化的训练数据所局限,难以揭示底层的复杂生物机制。
当前AI工作流过度依赖单点生物活性指标(如IC50、EC50、Ki值),而条件-值曲线(Condition–value curves)等能反映分子在不同条件下行为的丰富数据源却未得到充分利用。标准化指标虽然便于基准测试,却无法 encapsulate 实验条件的复杂性或分子相互作用的细微差别。例如,IC50值无法体现剂量反应曲线的斜率或拐点,而这些信息可能揭示药物的效力和特异性。
整合条件依赖性动力学数据可显著增强AI模型的预测能力,并有助于发现新的生物学机制。通过纳入多维实验数据,AI可以超越简单的定量构效关系(QSAR)模型,转向能够捕捉生理相关性的预测框架。
对药物发现全流程(靶点识别、苗头化合物发现、先导化合物优化、临床前试验、临床药理学)的AI应用调研显示,现有工具多为任务特异性开发,缺乏跨阶段的迭代整合。这种碎片化与药物发现的本质相悖——临床前或临床试验的失败常需回溯至早期阶段重新筛选候选分子,导致效率低下和成本高昂。
尽管已有研究尝试将多目标分子设计(Multiobjective Molecular Design)等方法用于整合苗头识别与先导优化,但真正贯穿管道始终的整体性AI方法仍探索不足。跨阶段集成AI的关键挑战包括数据标准化、模型可解释性(XAI)以及知识传递机制。
为弥合上述鸿沟,需推动AI从还原论、任务特异性算法向整体性、生物基础框架转变。核心方向包括:开发能够区分结合亲和力与生物活性的情境感知模型;利用条件-值曲线等丰富数据集增强预测深度;构建端到端(End-to-End)AI平台,集成多尺度生物学知识(从分子相互作用到生理表型)。同时,应加强医学生物学与AI领域间的跨学科协作,确保计算工具与生物现实对齐。
通过将多尺度生物语境嵌入AI模型,并促进跨管道集成,有望显著提升AI在药物发现中的转化影响力。未来工作应聚焦于开发生物情境化数据标准、可解释AI工具以及支持迭代优化的学习框架,最终加速安全有效疗法的开发进程。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号