基于对抗一致性互补约束双视图学习的药物共晶预测新方法
《Big Data Mining and Analytics》:Compound Cocrystal Prediction via Dual-View Learning Framework Under Adversarial Consistency and Complementarity Constraints
【字体:
大
中
小
】
时间:2025年11月27日
来源:Big Data Mining and Analytics 6.2
编辑推荐:
本研究针对药物共晶预测中双视图特征冗余与信息互补难题,提出基于生成对抗网络(GAN)的双视图组合器,通过正交分离视图共享与视图特异性表征,显著提升预测精度。实验表明DVL-CC模型在三种预测场景下均优于现有方法,并能识别氢键和π-π堆积等关键原子相互作用,为药物开发提供新思路。
在药物研发领域,共晶技术能有效改善活性药物成分的物理化学性质,且不改变其化学结构,已成为提升药物溶解度和生物利用度的关键策略。然而,传统的共晶筛选方法依赖大量生物实验,存在耗时耗力、成本高昂的瓶颈。随着剑桥结构数据库(CSD)中测定共晶数量的增长,计算预测方法逐渐成为加速共晶发现的新途径。
现有机器学习方法主要分为基于网络推荐和基于分类的两大类。前者通过构建化合物共晶网络进行推断,但无法预测网络中孤立化合物或全新化合物的共晶;后者将化合物对作为样本训练分类器,但其性能高度依赖分子表征质量。近年来,双视图学习(DVL)通过整合化合物的序列视图(SMILES字符串)和结构视图(2D分子图)等多源信息,显著提升了模型性能。然而,如何有效消除双视图间的冗余特征,同时保留视图间的一致性和互补性,仍是亟待解决的核心难题。
针对这一挑战,西北工业大学研究团队在《Big Data Mining and Analytics》发表了一项创新研究,提出名为DVL-CC的双视图学习框架。该框架通过引入对抗一致性约束和互补性正交分离技术,实现了对共晶形成关键原子的精准识别,为药物共晶预测提供了新的解决方案。
研究团队采用多模块协同的架构设计,主要包括:(1)基于GNNML的图神经网络编码器处理分子结构视图;(2)基于预训练Transformer的序列编码器处理SMILES字符串;(3)核心的双视图组合器,包含GAN驱动的一致性学习器和正交互补约束模块;(4)多层感知机实现的二元预测器。实验采用包含396种药物化合物和3455种非药物化合物的基准数据集(DB1)进行十折交叉验证,并使用包含四种药物及其共晶/非共晶的独立数据集(DB2)验证泛化性能。
研究结果通过多维度验证展现了模型的优越性。在跨视图表征学习方面,结构特异性特征对预测贡献最大(特征置换实验显示其性能下降12.15%),而共享特征影响相对较小。通过t-SNE降维可视化可见,结合视角特异性和共享特征的嵌入空间能更清晰区分共晶与非共晶样本。
案例研究进一步验证了模型的可解释性。以间苯二酚-环丁烷共晶为例,模型成功识别出羟基氧原子和吡啶环氮原子作为关键原子,与CSD中记录的氢键形成位点高度一致。而芘-氯醌共晶的预测结果则显示苯环碳原子主导的π-π堆积作用,与文献报道的平行堆叠模式相符。这些发现证实模型能有效捕捉氢键和π-π堆积等关键分子间相互作用。
在消融实验中,移除双视图组合器导致最难预测场景(CVS3)的平衡准确率下降3.64%,证明正交分离技术对提升模型泛化能力的关键作用。与现有最优方法相比,DVL-CC在跨化合物预测(CVS3)和独立测试(IND)场景下分别实现17.12%和26.98%的性能提升,显著优于CCGNET等对比模型。
该研究的创新性主要体现在三个方面:首先,通过GAN驱动的对抗学习机制提取跨视图一致性特征,突破传统拼接方法的表征冗余限制;其次,利用 Frobenius 范数正交约束确保视图特异性与共享特征的互补性;最后,基于注意力权重的原子级可解释性分析,为共晶形成机制研究提供新视角。
研究人员指出,当前研究仍面临正负样本不平衡的技术挑战。未来工作将探索SMOTE过采样、代价敏感学习等策略优化数据分布,同时拓展模型在药物-靶点相互作用预测等生物医学场景的应用。随着多组学数据与高通量筛选技术的深度融合,这种多视角学习框架有望在个性化医疗和药物重定位等领域发挥更大价值。
综上所述,DVL-CC框架通过创新性地融合对抗学习与正交约束技术,实现了药物共晶预测精度与可解释性的双重突破。其提出的视图解耦方法论不仅适用于共晶预测领域,也为多源生物医学数据整合分析提供了普适性技术范式,对加速药物研发进程具有重要推动作用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号