
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Enalos云平台的深度学习与协同共识模型预测小分子PPARγ结合效能及拮抗活性研究
【字体: 大 中 小 】 时间:2025年06月15日 来源:Molecular Diversity 3.9
编辑推荐:
这篇综述介绍了两种先进的计算机模型:基于分子对接评分的神经网络(NN)分类器用于预测小分子与过氧化物酶体增殖物激活受体γ(PPARγ)的结合强度,以及整合随机森林(RF)、支持向量机(SVM)和k近邻(kNN)的协同共识模型用于拮抗活性预测。研究严格遵循经济合作与发展组织(OECD)指南进行验证,并通过34种全氟/多氟烷基物质(PFAS)案例展示其应用价值,最终将模型部署于用户友好的Enalos云平台,为糖尿病治疗候选药物发现和环境化学风险评估提供高效虚拟筛选工具。
过氧化物酶体增殖物激活受体γ(PPARγ)拮抗剂在调节葡萄糖和脂质代谢中起关键作用,是抗糖尿病疗法的潜力靶点。本研究开发了两种计算机模型:基于分子对接评分的神经网络分类器用于区分强/弱结合剂,以及整合随机森林(RF)、支持向量机(SVM)和k近邻(kNN)的协同共识模型预测拮抗活性。模型通过OECD指南验证,并应用于34种优先PFAS的筛选,最终集成至Enalos云平台实现高效虚拟筛选。
PPARγ作为核受体NR1C亚家族成员,通过与RXR形成异源二聚体调控靶基因表达。尽管噻唑烷二酮类(TZD)药物如罗格列酮是经典PPARγ激动剂,但其副作用促使研究者转向拮抗剂开发。定量构效关系(QSAR)与深度学习(DL)技术的结合为加速发现新型PPARγ调节剂提供了可能,而PFAS因其环境持久性和潜在核受体干扰效应成为重点研究对象。
数据准备:采用Tox21计划的PPARγ-bla HEK293H细胞系高通量筛选数据(PubChem AID 743199),经去重和盐过滤后获得6,587个化合物,其中含220种PFAS。
分子对接:使用Enalos Asclepios KNIME流程,基于5YCP晶体结构进行AutoDock Vina-GPU对接,网格中心定位于罗格列酮配体质心,能量阈值剔除阳性结合化合物。
深度学习模型:通过k均值聚类将结合能(-13至-0.6 kcal/mol)分为强结合(中心-8.06 kcal/mol)和弱结合(中心-5.49 kcal/mol)两类。采用半径4的扩展连通性指纹(ECFP4
)和DeepChem库构建全连接神经网络(NN),经网格搜索优化后获得最佳架构(ReLU激活函数,Sigmoid输出层)。
协同共识模型:通过Mold2计算777个分子描述符,经低方差过滤后保留407个。采用随机欠采样(RUS)处理数据不平衡(活性率6.5%),通过BestFirst和InfoGain特征选择方法分别训练RF、SVM和kNN模型,最终以多数投票形成共识模型。
模型性能:NN模型在测试集准确率达82.1%(ROC-AUC 0.893),显著优于传统算法(RF 77.4%,kNN 70.1%)。共识模型在十折交叉验证中平衡准确率83.5%,F1值78.1%,优于单模型(RF 80.3%,SVM 73.5%,kNN 73.0%)。
关键描述符:极性加权自相关描述符(ATSp,3)和Burden特征值被识别为核心影响因素,与PPARγ配体结合腔的拓扑化学特性密切相关。
应用案例:34种PFAS的预测显示均为非拮抗剂,但ADONA和GenX等替代品显示强结合能,与文献报道的潜在部分激动效应一致。通过Titania平台补充计算的水溶性、生物富集因子等参数为风险评估提供多维依据。
本研究建立的NN-共识模型双工作流程为PPARγ调节剂发现提供了高效工具,其云端部署(https://enaloscloud.novamechanics.com)实现了FAIR(可发现、可访问、可互操作、可重用)原则。尽管PFAS预测结果需实验验证,但模型展现的结构-活性关系解析能力为环境污染物筛查和药物设计提供了新范式。
生物通微信公众号
知名企业招聘