基于PU学习和多层感知机的多药联用副作用检测方法PU-MLP研究

【字体: 时间:2025年06月03日 来源:Intelligence-Based Medicine CS5.0

编辑推荐:

  为解决多药联用( Polypharmacy )导致的药物相互作用副作用检测难题,研究人员开发了基于PU( Positive Unlabeled )学习和多层感知机( MLP )的PU-MLP模型。该研究通过随机森林特征提取、图神经网络( GNN )嵌入和降维技术构建药物特征表示,结合PU学习处理数据不确定性,最终实现多药联用副作用的高精度预测。5折交叉验证显示模型在AUPR、AUC和F1指标上分别达到0.99、0.99和0.98,显著优于现有方法,为临床用药安全提供新工具。

  

随着老龄化社会进程加速,多药联用( Polypharmacy )已成为慢性病管理的普遍现象。统计显示,67%的美国老年人同时使用5种以上药物。虽然这种用药策略能提升治疗效果,但药物相互作用( DDI )导致的副作用却成为急诊就诊的主要原因之一。传统临床试验因成本高、周期长,难以全面检测罕见副作用,这促使计算生物学方法成为研究热点。然而现有技术面临三大挑战:药物特征表征不充分、数据标注不确定性高,以及多标签分类的复杂性。

针对这些难题,研究人员开发了名为PU-MLP的创新模型。该研究通过三阶段策略突破技术瓶颈:首先整合随机森林分类器、图神经网络( GNN )和降维技术构建药物特征向量;其次采用Elkan-Noto提出的PU学习算法处理未标注数据;最后设计包含批量归一化和dropout机制的多层感知机( MLP )进行副作用预测。研究使用TWOSIDES和OFFSIDES基准数据集,涵盖645种药物及其靶点、酶、通路等特征。

特征提取阶段比较了SPP( Similar Patterns of target-Proteins )、LAS( Large Average Submatrices )和CCA( Canonical Correlation Analysis )等双聚类算法,发现随机森林结合GNN嵌入的特征组合效果最优。PU学习模块通过概率估计区分正负样本,使模型在数据标注不全时仍保持高鲁棒性。最终的MLP架构采用单隐藏层设计,使用ReLU激活函数和SGD优化器,通过10轮早停策略防止过拟合。

研究结果显示,PU-MLP在平衡数据集上的AUROC达0.992,较对比方法提升4%。特别在酶特征(E)预测中,AUPRC达到0.999的近乎完美水平。与当前最优的PU-GNN相比,新方法在保持0.98F1值的同时,将准确率从0.972提升至0.998。在临床更常见的非平衡数据场景下,模型对37264个药物对的预测精度仍稳定在0.983,显著优于DeSIDE-DDI等现有方法。

这项发表于《Intelligence-Based Medicine》的研究具有重要临床意义。其创新的PU学习框架有效解决了药物副作用数据标注不全的行业难题,而多层感知机与特征工程的结合为多药联用风险预警提供了新范式。特别是模型对罕见副作用的预测能力,可辅助医生优化复杂处方方案。未来通过整合电子病历等实时数据,该技术有望发展成临床决策支持系统的核心组件,为精准用药提供智能保障。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号