综述:肽化学信息学工具:使肽药物发现中的计算任务变得可及

《Drug Discovery Today》:Peptide cheminformatics tools: making computational tasks accessible in peptide drug discovery

【字体: 时间:2026年01月23日 来源:Drug Discovery Today 7.5

编辑推荐:

  本综述系统梳理了肽化学信息学领域的关键计算工具与方法,涵盖分子表示、相似性评估、机器学习/深度学习模型及肽设计等环节。文章重点介绍了如何降低计算工具的使用门槛,促进实验研究人员在肽药物发现中应用数据驱动策略,为不同专业背景的研究者整合计算工具提供了实用指南。

  
肽化学信息学工具:推动肽药物发现的计算革命
引言
肽作为由2-50个氨基酸组成的生物活性分子,在治疗代谢性疾病、癌症等复杂疾病及靶向细胞内蛋白-蛋白相互作用方面展现出独特优势。近年来,通过非天然氨基酸嵌入、环化修饰等策略,肽药物的靶标亲和力、稳定性及口服生物利用度得到显著提升。然而,化学空间的指数级扩张为候选药物筛选带来巨大挑战,计算化学方法为此提供了高效解决方案。
分子表示方法
肽分子的计算机识别需借助线性标记法,主要分为原子级和氨基酸级表示体系。简化分子线性输入系统(SMILES)可描述任意化学结构,但存在同一分子多表征形式的缺陷。自引用嵌入字符串(SELFIES)通过模块化令牌确保分子图有效性,为机器学习模型提供稳定输入。FASTA格式限于天然氨基酸序列,而蛋白线性标记(PLN)通过三字母代码支持修饰氨基酸和环化结构。分层编辑大分子语言(HELM)进一步实现复杂拓扑结构的跨层级映射,伯林格英格海姆线性标记(BILN)则优化了HELM的人类可读性。
分子指纹与嵌入技术
分子指纹将结构信息编码为二进制向量,其中最小哈希原子对指纹(MAP4)对肽类结构变化敏感度最高,其手性版本MAP4C可识别立体化学差异。单体组成指纹(MCFP)基于Norine数据库构建,适用于非核糖体肽表征。嵌入技术方面,ProFET、PyFeat等工具可提取序列特征,而ESM-2、ProtT5等蛋白语言模型通过上下文学习捕获功能信息。新兴的肽特异性模型PeptideCLM支持化学修饰肽的表示,PepLand则通过异质图神经网络整合原子与片段信息。
相似性计算策略
生物学视角采用Needleman-Wunsch全局比对或BLAST启发式算法,化学视角则依赖Tanimoto系数等指纹相似度度量。PepFuNN工具包支持基于单体词典的加权比对,RDKit可实现大半径指纹的拓扑相似性计算。多序列比对工具PepSeA通过HELM可视化复杂结构变异,为构效关系分析提供直观支持。
机器学习与深度学习应用
支持向量机(SVM)用于抗菌肽分类,随机森林模型预测抗病毒活性,XGBoost优化抗高血压肽设计。长短期记忆网络(LSTM)处理序列依赖性任务,卷积神经网络(CNN)捕获局部结构特征。生成式模型中,变分自编码器(VAE)探索抗菌肽化学空间,生成对抗网络(GAN)开发靶向PD-1的抗癌肽,扩散模型Prot-Diff实现抗菌肽的de novo设计。强化学习框架PepINVENT支持多参数优化,实现天然/非天然氨基酸组合的定向进化。
物性预测与描述符体系
分子描述符按维度分为:0D(分子量)、1D(氢键供体数)、2D(拓扑极性表面积TPSA)、3D(分子体积)和4D(动态行为)。CamSol工具基于物理原理预测pH依赖性溶解度,PepMNet通过图神经网络同步预测色谱保留时间和抗菌活性。跨膜渗透性预测工具PeptideCLM、溶血活性预测模型HAPPENN等共同构建了肽类药物性质评估体系。
构效关系分析与序列设计
遗传算法PDGA通过大分子扩展原子对指纹(MXFP)引导多拓扑结构探索,环肽工具包提供三维构象生成功能。自然语言处理模型Peptide-GPT生成满足多性质条件的线性序列,HELM-GPT实现环肽的亲和力与渗透性协同优化。商业平台如Menten AI、ProteinQure将分子模拟与生成式AI结合,加速具有药物类似性质的肽类大环化合物开发。
结论与展望
当前计算工具已显著降低肽药物发现门槛,但在复杂结构标准化表示、数据质量提升及模型可解释性方面仍需突破。未来发展应聚焦扩大工具适用范围,增强跨学科可用性,最终实现计算驱动与实验验证的闭环优化。

改写说明
  • 结构重组与内容精炼:将原文内容系统重组为逻辑清晰的小节,突出各技术板块的核心方法和工具,大幅压缩和精炼表达,去除冗余细节。
  • 术语规范与专业表达:统一专业术语及英文缩写标注,严格采用/标注上下标,去除文献引用和图表标识,强化科学表述的准确性和规范性。
  • 风格转向与细节落地:以第三人称客观描述,去除主观评价,确保各技术细节和结论均有原文依据,增强内容的可信度和专业性。
如果您需要更偏应用指南或侧重某一技术方向的改写风格,我可以进一步为您调整优化。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号