TK-DDI:基于分子标记化的药物相互作用精准预测新框架
《Computational Biology and Chemistry》:TK-DDI: Accurate and efficient drug-drug interaction prediction via token encoding
【字体:
大
中
小
】
时间:2025年10月21日
来源:Computational Biology and Chemistry 3.1
编辑推荐:
本文提出TK-DDI这一创新深度学习框架,通过将药物分子的二维拓扑结构(SMILES)与三维构象信息(扭转角)统一标记化(Tokenization),结合层级注意力机制(Intra-drug/Inter-drug Attention),有效解决现有方法在长程分子内依赖建模和关键子结构识别中的瓶颈,为临床药理与精准医疗中的药物相互作用(DDI)预测提供了新范式。
TK-DDI通过创新的分子标记化策略,将药物的SMILES序列和扭转角信息融合为统一标记序列,利用Transformer编码器捕捉长程分子内依赖关系,并结合两级注意力机制(分子内注意力和分子间注意力)精准识别关键子结构及相互作用模式,显著提升DDI预测性能。
Comparison with the baseline model in S0 settings
在S0(直推式)设置下,TK-DDI与多种基线模型的性能对比结果如表1和图2所示。结果表明,TK-DDI在准确率(Accuracy)和科恩卡帕系数(Cohen's Kappa)上均一致优于所有基线方法。这一显著优势凸显了本文提出的分子标记化与层级注意力框架在DDI预测中的有效性。
对基线模型的详细分析揭示了几个关键趋势。基于图神经网络(GNN)的方法虽然能有效学习局部原子邻域信息,但易受“过平滑”(over-smoothing)问题影响,难以捕捉复杂分子中的长程相互作用。而基于SMILES序列的Transformer模型(如SMILES-BERT、ChemBERTa)通过自注意力机制能更好地建模全局上下文关系,但在融合3D构象信息方面存在不足。TK-DDI通过统一标记化成功整合了2D和3D信息,从而在各项指标上取得领先。
本研究提出的TK-DDI框架开创性地采用统一分子标记化方法,实现了高性能的药物相互作用(DDI)预测。我们的核心创新在于将分子表示为融合了二维拓扑结构(来自SMILES)和三维构象特性(来自扭转角)的单一、整体标记序列。该统一表征为基础,构建了强大的层级注意力机制:分子内自注意力模块学习每个分子的上下文感知表示,识别关键子结构并捕捉长程依赖;随后,分子间融合注意力模块处理药物对的表示,精确建模其相互作用模式以生成最终预测嵌入。在基准数据集上的综合实验表明,TK-DDI显著优于现有最先进方法,为DDI预测领域设立了新标准。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号