综述:人工智能在生物制药天然产物生物勘探中的应用

【字体: 时间:2025年07月16日 来源:BMC Artificial Intelligence

编辑推荐:

  这篇综述系统阐述了人工智能(AI)在天然产物生物勘探(bioprospecting)中的革命性作用,重点探讨了机器学习(ML)、深度学习(DL)和化学信息学(cheminformatics)等技术如何加速抗菌、抗癌和抗炎化合物的发现。文章通过案例研究(如抗生素halicin的AI预测)展示了AI在结构-活性关系(SAR)预测、虚拟筛选和基因组挖掘(BGCs识别)中的突破性应用,同时指出数据质量、模型可解释性及生物多样性保护等挑战,为未来精准生物勘探(precision bioprospecting)与个性化医疗提供新范式。

  

引言

生物勘探——从天然资源中系统搜寻生物活性化合物的过程,几个世纪以来一直是药物发现的基石。然而传统方法面临耗时、资源密集和生态系统复杂性等限制。人工智能(AI)通过机器学习(ML)、深度学习(DL)等技术显著提升了天然化合物发现的效率,例如利用卷积神经网络(CNN)分析海洋海绵提取物预测抗癌活性,或将随机森林(RF)模型用于抗菌肽(AMPs)筛选。

AI技术体系

机器学习与深度学习

支持向量机(SVM)通过最优超平面划分植物代谢物的抗增殖活性,而图神经网络(GNN)直接处理分子图数据,如预测黄酮类化合物的结合亲和力。深度学习方法如DeepBGC利用卷积神经网络识别微生物基因组中的生物合成基因簇(BGCs),成功发现单氮霉素等具有微摩尔级抗癌活性的化合物。

化学信息学整合

AI驱动的虚拟筛选将化合物库分析时间从数月缩短至数天。例如,GraphDTA模型通过原子节点和化学键边的信息传递,预测药物-靶点结合亲和力,准确率超越传统方法。生成对抗网络(GAN)则设计出结构全新的DDR1激酶抑制剂,其结合效能经体外实验验证。

多组学数据融合

自动编码器可去除质谱数据的噪声,提升代谢物鉴定精度。一项结直肠癌研究中,集成模型通过血浆代谢组学识别出13个差异代谢物,涉及精氨酸和谷胱甘肽代谢通路,曲线下面积(AUC)达0.993。

突破性应用

抗癌药物发现

AI预测的海洋来源化合物通过诱导凋亡和抑制酪氨酸激酶显示抗癌活性。分子对接模拟发现,某些天然产物与CDK20激酶的预测结合模式经AlphaFold结构验证,后续合成化合物在肝癌模型中证实疗效。

抗生素开发

深度学习模型筛查1亿化合物库发现halicin,其通过破坏细菌质子动力发挥广谱抗菌作用。另一研究采用可解释AI解析抗生素化学亚结构,获得对耐甲氧西林金黄色葡萄球菌(MRSA)有效的新型骨架。

神经保护剂探索

变分自编码器设计的二芳基腙类化合物,可抑制α-突触核蛋白聚集,效力比已知先导物高100倍。网络药理学分析还发现维生素E和头孢洛扎对帕金森病多靶点的协同作用。

挑战与展望

数据瓶颈

天然产物数据库如COCONUT和LOTUS虽提供开放资源,但微生物次级代谢产物的注释完整度不足30%。FAIR原则(可查找、可访问、可互操作、可重用)的推行有望改善数据质量。

模型透明度

深度学习的"黑箱"特性在药物审批中受监管关注。SHAP值分析等技术可揭示logP和芳香性等关键特征对活性的贡献,如RF模型确定这些参数在抗菌QSAR中占比达60%。

可持续发展

合成生物学与AI结合实现青蒿素酵母工程化生产,产量提升15倍。未来自主水下机器人(AUV)或将勘探深海热液喷口等极端环境,而Nagoya协议确保原住民社区公平分享惠益。

未来方向

精准生物勘探通过整合患者多组学数据,如KRAS野生型结直肠癌对姜黄素的特异性响应。生成式AI设计的TNIK抑制剂已进入抗纤维化临床试验,标志着AI驱动研发的全新范式。随着自动化平台与微流控技术的结合,天然药物发现正步入高通量、低生态影响的智能时代。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号