基于强化学习动态平衡奖励机制与三峰增强物化性质评分的蛋白质琥珀酰化位点预测新方法RLSuccSite

【字体: 时间:2025年06月03日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  针对蛋白质翻译后修饰(PTMs)中琥珀酰化位点预测存在的数据不平衡和序列特征表征不足问题,Changzhou University团队开发了RLSuccSite模型。该研究首次将强化学习(PPO算法)与动态平衡奖励机制结合,并创新性提出三峰增强物化性质评分(TPEM-PPS)特征提取方法,在BAcc(73.02%)、MCC(37.76%)等指标上显著优于现有工具,为代谢疾病和癌症相关PTM研究提供了新范式。

  

在细胞生命活动的精密调控网络中,蛋白质翻译后修饰(PTMs)如同分子世界的"化学开关",通过共价修饰动态调节蛋白质功能。琥珀酰化(succinylation)作为一种新兴PTM类型,虽在代谢调控和癌症发生中扮演关键角色,却因研究难度大、数据稀缺而长期处于"灰姑娘"地位。传统机器学习方法在预测琥珀酰化位点时面临两大"拦路虎":样本不平衡(阳性样本仅占19.4%)和序列特征表征不足。这导致模型往往沦为"偏科生",对阴性样本预测准确率虚高,却对真正的琥珀酰化位点"视而不见"。

为破解这一困境,常州大学计算机科学与人工智能学院的研究团队在《Journal of Cheminformatics》发表了创新性成果RLSuccSite。该研究首次将强化学习的"试错学习"机制引入PTM预测领域,通过近端策略优化(PPO)算法和动态平衡奖励机制的"双轮驱动",使模型在15,310个阳性样本和65,258个阴性样本的"非对称战场"上实现了72.76%灵敏度(Sn)与73.29%特异性(Sp)的完美平衡。更令人振奋的是,团队开发的"三峰增强物化性质评分"(TPEM-PPS)特征提取法,通过高、中、低三峰权重分配,让氨基酸残基的贡献度首次实现"位置感知",使特征维度从传统方法的400维跃升至528维。

关键技术方法
研究团队从UniProt等数据库获取蛋白质序列,采用CD-Hit(相似度阈值0.4)去冗余后构建数据集。特征提取阶段创新性融合ProtT5的1024维嵌入向量与TPEM-PPS_CCP(包含CKSAAP、CTDC、PseAAC)的990维特征。模型训练采用PPO-Clip算法,策略网络和价值网络均为512节点全连接层,通过动态奖励函数(初始权重w=10.0,不平衡系数r=4.2)实现自适应优化。性能评估采用5折交叉验证,以BAcc、MCC等指标对比9种现有工具。

研究结果

特征消融实验
ProtT5单特征表现最佳(BAcc 68.62%,MCC 31.01%),而TPEM-PPS通过三峰增强策略(高峰GB、中峰PB、低峰DB)使特征组合TPEM-PPS_CCP的AUC达0.7652。图6热图显示TPEM-PPS与CTDC组合时MCC提升最显著(Δ+7.62%)。

奖励机制对比
动态奖励(D_R)以70.43% BAcc完胜固定奖励策略。图8显示其累积奖励呈线性增长,而1_1机制因过度惩罚FN导致奖励曲线"畏首畏尾"。

算法性能验证
PPO以70.72% BAcc领跑7种强化学习算法(图10),其AP值(0.4621)比次优算法MARL高3.6%。在100次随机种子实验中(图15),RLSuccSite的MCC值在87%比较中稳居第一。

实际应用验证
对UniProt 2024年后新发现的琥珀酰化位点预测准确率达70%(表6),如ECXLI蛋白的K251位点预测成功,而HMCS2_MXXSE蛋白的K221位点出现误判。

结论与展望
该研究开创了强化学习在PTM预测领域的"破冰"应用,其动态平衡机制如同"智能配平器",使模型在数据倾斜的"跷跷板"上保持稳定。TPEM-PPS特征通过物理化学性质与空间位置的"三维编码",实现了从"序列指纹"到"功能密码"的跨越。未来研究可探索奖励函数的自动化优化,并将框架扩展至磷酸化等更多PTM类型。正如作者Sen Yang所述:"RLSuccSite不仅是一把打开琥珀酰化机制的钥匙,更为解决生物医学中的类别不平衡问题提供了普适性方案。" 这项来自中国团队的研究,正推动蛋白质修饰预测迈入"强化智能"新时代。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号