MDM-DTA：一种结合分子描述符和专家混合模型的消息传递神经网络，用于药物-靶点亲和力预测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Computer Methods and Programs in Biomedicine》：MDM-DTA: Message Passing Neural Network with molecular descriptors and Mixture of Experts for drug-target affinity prediction

【字体：大中小】 时间：2025年11月23日 来源：Computer Methods and Programs in Biomedicine 4.8

编辑推荐：

　　针对药物-靶点亲和力（DTA）预测中多模态融合不足的问题，本文提出MDM-DTA框架，整合分子图、分子描述符与语义嵌入，采用混合专家机制和等距回归校正，显著提升预测准确性和稳定性。

　　在现代药物研发领域，药物与靶点的亲和力预测（Drug-Target Affinity, DTA）是一个至关重要的环节。这一过程通过计算小分子药物与靶蛋白之间的结合亲和力，为药物筛选和开发提供了理论依据，从而降低研发成本、缩短开发周期，并减少临床试验中的失败风险。随着人工智能技术的发展，尤其是深度学习和自然语言处理在生物医学领域的应用，DTA预测方法也经历了从单一特征分析到多模态融合的演变过程。

传统的DTA预测模型通常采用独立提取和拼接药物与蛋白质特征的方法。这种方法虽然在一定程度上能够提供有用的信息，但其局限性在于无法充分捕捉蛋白质序列中的复杂语义关系，导致预测结果的准确性受到限制。近年来，研究者们尝试通过引入更复杂的网络结构和算法来解决这一问题。例如，基于图神经网络（Graph Neural Networks, GNNs）的方法能够更精确地建模分子结构，而大型语言模型（Large Language Models, LLMs）则通过将SMILES序列和氨基酸链映射到潜在的生化空间，引入了语义感知能力。然而，这些方法在融合不同模态信息时仍存在一定的挑战，如模态间的独立处理导致跨模态交互受限，以及融合策略较为浅层，难以实现有效的特征整合和语义对齐。

为了克服这些挑战，研究人员提出了多种创新的DTA预测模型。其中，TDGraphDTA通过引入基于扩散的图优化模块，提升了分子图的表达能力和可解释性。然而，这种方法在训练和推理过程中需要较高的计算资源，并且对图的质量依赖较强，当输入数据存在噪声或不完整时，模型性能会显著下降。Modality-DTA则尝试整合药物和靶点的多模态特征，如Morgan指纹、SMILES序列以及氨基酸的一热编码表示。虽然这种方法在一定程度上缓解了单一模态信息不足的问题，但其融合策略仍较为浅层，缺乏对跨模态互补性和交互性的深入建模。MDCT-DTA在此基础上引入了多尺度图扩散卷积（Multi-Scale Graph Diffusion Convolution, MGDC）模块，以捕捉分子图节点之间的复杂相互作用，同时结合了卷积神经网络（CNN）和Transformer的混合架构，用于建模蛋白质序列中的长程依赖关系和局部交互。尽管这一设计提升了特征表示的丰富性和模型的鲁棒性，但其融合机制仍局限于特征层面，未能充分探索语义对齐和动态跨模态融合的可能性。MT-DTA进一步引入了变分自编码器（Variational Autoencoder, VAE）作为交互学习模块，以实现更深层次的子结构关系建模和药物-靶点特征之间的丰富交互。然而，这种多模块融合的方式在参数调优、训练时间和计算资源需求方面也带来了挑战，可能限制其在大规模数据集上的应用。

面对上述问题，本文提出了一种新的框架——MDM-DTA（Message Passing Neural Network with Molecular Descriptors and Mixture of Experts for Drug-Target Affinity Prediction），旨在通过多模态特征融合和动态特征选择机制，提升DTA预测的准确性。MDM-DTA的核心思想是将药物和蛋白质的多种表示方式整合到一个统一的潜在空间中，从而更全面地捕捉药物与靶点之间的复杂相互作用。具体而言，该框架结合了消息传递神经网络（Message Passing Neural Networks, MPNNs）和分子描述符（Molecular Descriptors），作为药物表示的基础模块，同时引入了一种稀疏的专家混合机制（Sparse Mixture of Experts, MoE），用于对多模态信息进行融合。此外，MDM-DTA还采用了等势回归校正（Isotonic Regression Correction）技术，以减少因输入敏感性引起的预测方差，从而提升预测结果的稳定性和准确性。

MDM-DTA的创新点在于其对多模态信息的整合方式。首先，药物表示方面，该模型利用分子图和分子描述符的组合。分子图通过消息传递神经网络进行处理，能够有效捕捉分子结构的拓扑关系；而分子描述符则通过三层卷积神经网络（CNN）进行特征提取，以增强对分子属性的表征能力。这两者的结合为药物提供了丰富的结构信息，使得模型能够更准确地识别药物与靶点之间的相互作用。其次，蛋白质表示方面，MDM-DTA采用了一种深度卷积网络，并结合了Squeeze-and-Excitation（SE）机制，以捕捉不同通道之间的依赖关系。此外，蛋白质序列的语义信息则通过预训练的蛋白质语言模型（如Knowledge-Guided BERT和Evolutionary Scale Modeling 2, ESM2）进行编码，这些模型能够捕捉蛋白质序列中的上下文关系，从而为预测提供更深层次的语义信息。

在模型架构设计上，MDM-DTA引入了混合专家机制（Mixture of Experts, MoE），这是一种能够动态选择和整合特征的策略。该机制通过一种基于top-k的门控策略（Gating Strategy）来选择最相关的特征，从而实现更有效的多模态信息融合。这种动态选择方式使得模型能够根据不同的输入数据调整特征权重，提高预测的灵活性和准确性。同时，MDM-DTA还采用了等势回归校正技术，通过强制DTA评分的单调性，确保预测结果的逻辑一致性，提高模型输出的可解释性。

为了验证MDM-DTA的有效性，本文在三个广泛使用的基准数据集（Davis、KIBA和Metz）上进行了广泛的实验。实验结果表明，MDM-DTA在预测准确性方面优于当前最先进的模型，尤其是在处理复杂结构和语义信息时表现突出。此外，通过消融实验，本文进一步分析了不同模块对模型性能的影响。结果表明，单独使用MPNN或分子描述符会导致预测误差显著增加，而结合多种模块则能够有效提升模型的鲁棒性和泛化能力。这说明，MDM-DTA通过多模态融合和动态特征选择，能够更全面地建模药物与靶点之间的相互作用，从而提升预测的准确性和稳定性。

MDM-DTA的提出不仅解决了当前DTA预测方法中的多个技术瓶颈，还为药物研发提供了新的思路。通过将药物和蛋白质的多种表示方式整合到统一的潜在空间中，MDM-DTA能够更有效地捕捉药物与靶点之间的复杂关系，从而提高预测的准确性。同时，混合专家机制和等势回归校正的引入，使得模型在处理多模态数据时更具灵活性和鲁棒性。这些技术的结合，不仅提升了模型的性能，还为后续的药物筛选和开发提供了更可靠的理论支持。

此外，MDM-DTA在处理药物和靶点数据时，充分考虑了生物医学领域的实际需求。例如，在药物表示方面，该模型不仅关注分子结构，还引入了分子描述符，以增强对分子属性的表征能力。而在蛋白质表示方面，该模型结合了深度卷积网络和预训练语言模型，以捕捉蛋白质序列中的上下文关系和潜在的生物信息。这种多模态融合方式，使得MDM-DTA能够更全面地理解药物与靶点之间的相互作用，从而提高预测的准确性。

在实际应用中，MDM-DTA的预测结果可以为药物研发提供重要的参考。例如，在药物筛选阶段，该模型能够帮助研究人员快速识别具有高亲和力的药物候选物，从而减少不必要的实验成本。在药物开发过程中，MDM-DTA的预测结果可以用于优化药物分子设计，提高药物与靶点的结合效率。此外，该模型还能够为药物-靶点相互作用的研究提供新的视角，帮助研究人员更深入地理解药物作用机制，从而推动药物研发的智能化进程。

综上所述，MDM-DTA的提出标志着DTA预测方法的一个重要进展。该模型通过多模态融合和动态特征选择机制，有效提升了预测的准确性和稳定性，为药物研发提供了新的工具。未来，随着深度学习和自然语言处理技术的不断发展，MDM-DTA的方法有望在更广泛的生物医学应用中得到推广和优化，为药物研发带来更大的价值。

联系信箱：

粤ICP备09063491号

热点排行