基于特征选择与集成学习的噬菌体病毒粒子蛋白预测模型PredPVP构建与应用

【字体: 时间:2025年07月01日 来源:Current Bioinformatics 2.4

编辑推荐:

  噬菌体疗法作为新型治疗手段前景广阔,其病毒粒子蛋白(PVP)在宿主识别和表面受体结合中起关键作用。来自国内的研究团队通过整合7种序列特征和3种特征选择方法,结合8种机器学习算法构建了集成预测模型PredPVP。该模型通过24个基模型的概率特征和类别特征(PCFs)进行逻辑回归(LR)训练,在独立测试集上达到93.4%的AUC值,性能优于现有工具,为抗菌药物开发提供了高效识别手段。

  

背景:噬菌体疗法作为革命性治疗策略展现出巨大潜力,其病毒粒子蛋白(Phage Virion Proteins, PVP)能够特异性识别宿主并锚定表面受体,这对开发针对细菌感染性疾病的新型抗菌药物具有重要意义。尽管已有基于单一特征的机器学习预测器,但高维特征表征往往蕴含更丰富的序列信息宝藏。

方法:研究团队创新性地构建了集成预测模型PredPVP,通过融合7种序列特征编码和3种特征选择方法剔除冗余信息,结合8种机器学习算法构建特征空间。24个基模型产生的概率特征与类别特征(Probability and Class Features, PCFs)经逻辑回归(Logistic Regression, LR)整合,最终形成具有多层决策能力的stacking架构。

结果:独立测试表明,PredPVP以93.4%的AUC值显著超越现有预测工具,特征选择策略使模型在保持高灵敏度(93.1%)的同时,特异性提升至85.7%。

意义:该模型不仅为大规模PVP鉴定提供了高效工具,其"多特征融合-特征选择-集成学习"的技术路线更为抗微生物药物研发开辟了新范式。开源代码和数据集将加速该技术在临床治疗中的实际应用转化。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号