
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于特征选择与集成学习的噬菌体病毒粒子蛋白预测模型PredPVP构建与应用
【字体: 大 中 小 】 时间:2025年07月01日 来源:Current Bioinformatics 2.4
编辑推荐:
噬菌体疗法作为新型治疗手段前景广阔,其病毒粒子蛋白(PVP)在宿主识别和表面受体结合中起关键作用。来自国内的研究团队通过整合7种序列特征和3种特征选择方法,结合8种机器学习算法构建了集成预测模型PredPVP。该模型通过24个基模型的概率特征和类别特征(PCFs)进行逻辑回归(LR)训练,在独立测试集上达到93.4%的AUC值,性能优于现有工具,为抗菌药物开发提供了高效识别手段。
背景:噬菌体疗法作为革命性治疗策略展现出巨大潜力,其病毒粒子蛋白(Phage Virion Proteins, PVP)能够特异性识别宿主并锚定表面受体,这对开发针对细菌感染性疾病的新型抗菌药物具有重要意义。尽管已有基于单一特征的机器学习预测器,但高维特征表征往往蕴含更丰富的序列信息宝藏。
方法:研究团队创新性地构建了集成预测模型PredPVP,通过融合7种序列特征编码和3种特征选择方法剔除冗余信息,结合8种机器学习算法构建特征空间。24个基模型产生的概率特征与类别特征(Probability and Class Features, PCFs)经逻辑回归(Logistic Regression, LR)整合,最终形成具有多层决策能力的stacking架构。
结果:独立测试表明,PredPVP以93.4%的AUC值显著超越现有预测工具,特征选择策略使模型在保持高灵敏度(93.1%)的同时,特异性提升至85.7%。
意义:该模型不仅为大规模PVP鉴定提供了高效工具,其"多特征融合-特征选择-集成学习"的技术路线更为抗微生物药物研发开辟了新范式。开源代码和数据集将加速该技术在临床治疗中的实际应用转化。
生物通微信公众号
知名企业招聘