
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DTI-RME:基于鲁棒损失、多核学习和集成学习的药物-靶点相互作用预测新方法
【字体: 大 中 小 】 时间:2025年07月29日 来源:BMC Biology 4.4
编辑推荐:
本研究针对药物-靶点相互作用(DTI)预测中存在的标签噪声、多视图融合不足和结构建模不完整三大挑战,开发了DTI-RME创新框架。该方法整合L2-C鲁棒损失函数、多核学习(MKL)和集成学习策略,在五个真实数据集上验证显示其AUPR指标最高提升22.66%,成功预测17个新型DTI,为药物发现提供了高效计算工具。
在药物研发领域,准确预测药物与靶点蛋白的相互作用(Drug-Target Interaction, DTI)是发现新药和药物重定位的关键。然而传统实验方法耗时耗力,而现有计算方法面临三大瓶颈:相互作用矩阵中的标签噪声(未发现的真阳性被误标为阴性)、多源异构数据融合困难、以及单一模型难以捕捉药物-靶点系统的复杂结构特征。这些问题严重制约了DTI预测的准确性和泛化能力。
电子科技大学的研究团队在《BMC Biology》发表的研究中,提出了DTI-RME创新框架。该方法通过三个关键技术创新:1) 设计L2-C混合损失函数,对正负误差分别采用C-loss和L2 loss处理;2) 开发自适应多核学习(Multi-Kernel Learning, MKL)算法动态整合11种药物和靶点特征核;3) 采用集成学习同时建模药物结构、靶点结构、药物-靶点对结构和低秩结构四种数据特征。在核受体(NR)、离子通道(IC)等五个基准数据集上,DTI-RME的AUPR最高达96.4%,较现有最佳方法提升5.38%。特别在预测新靶点(CVT)场景下,AUPR提升幅度达22.66%。通过分子对接验证,排名前50的预测中有17个被DrugBank 6.0数据库证实。
研究采用多模态计算生物学方法:1) 构建包含药物化学结构、靶点序列等11种特征核的异构网络;2) 设计交替优化算法求解包含九类参数的L2-C目标函数;3) 采用五折交叉验证评估CVP(药物-靶点对)、CVD(新药物)和CVT(新靶点)三种预测场景;4) 通过t-SNE可视化分析潜在特征空间分布;5) 使用AmberTools进行分子动力学模拟验证top预测结果。
【METHODOLOGY】
研究创新性地提出L2-C损失函数,通过实验证明其在处理矩阵噪声方面的优势。如图2所示,C-loss的有界特性使其对异常值更鲁棒,而L2项则保证对负误差的强惩罚。这种混合策略使AUPR在Luo数据集上提升至63.68%,显著优于传统加权损失。

【Multi-kernel learning】
通过热图分析(图4)显示,基于相关性核KCorr的单一视图性能最差,而MKL框架通过自适应权重分配整合多源数据,使AUPR在IC数据集达到96.4%。参数分析(图7a-b)揭示药物副作用特征核和靶点GO注释核贡献度最高。

【Ensemble learning】
关键差异图(图5)显示,集成四种结构的DTI-RME在NR数据集CVP场景下AUPR达74.73%,显著优于单一结构模型。其中药物-靶点对结构在CVP中表现最佳(AUPR 0.928),而药物结构在CVT场景更有效,证实多结构互补价值。

【Case study】
对5-羟色胺受体1A(P08908)与麦角胺(DB00696)的预测验证显示(表7),DTI-RME成功捕捉到该配体-受体对的构象变化信号传导机制。分子动力学模拟(图9)观察到ASP-135残基形成关键氢键,证实预测的生物学合理性。
该研究通过系统解决DTI预测的三大核心挑战,建立了兼顾精度与鲁棒性的计算框架。其技术突破不仅限于DTI预测,在微生物-疾病关联(HMDA)和lncRNA-疾病关联(LDA)预测中也展示出优秀泛化能力(表6)。未来结合深度学习增强特征表达能力,可进一步拓展其在多组学数据整合中的应用前景。
生物通微信公众号
知名企业招聘