基于深度表征学习的抗氧化肽预测框架AOP-DRL:突破传统鉴定方法的计算生物学创新

【字体: 时间:2025年08月16日 来源:Computational and Structural Biotechnology Journal 4.1

编辑推荐:

  为解决传统抗氧化肽(AOP)鉴定方法面临的可扩展性挑战,湖南师范大学医学院团队开发了深度表征学习框架AOP-DRL。该研究整合蛋白质语言模型与分层卷积网络,在P60-P90数据集上实现最高7.26%的准确率提升,为功能性食品和个性化医疗提供高效计算工具。

  

在生命活动中,分子氧(O2)如同"生命之分子",但代谢过程中产生的活性氧(ROS)却会引发氧化应激,导致脂质过氧化、DNA断裂和蛋白质错误折叠等一系列生物分子损伤。虽然抗氧化肽(AOPs)能有效中和ROS,但传统鉴定方法如iTRAQ和2D-PAGE存在耗时耗力、难以规模化等问题。更棘手的是,现有计算模型在处理可变肽段长度、捕捉非线性残基相互作用等方面存在明显局限。

为突破这些技术瓶颈,湖南师范大学医学院的研究团队开发了抗氧化肽深度表征学习框架AOP-DRL。这项创新性研究发表在《Computational and Structural Biotechnology Journal》上,通过整合进化规模的蛋白质语言模型与层次化卷积网络,建立了高效的高通量预测系统。

研究团队采用三项关键技术:首先从公开数据库获取687条实验验证的抗氧化序列和717条阴性对照,构建标准化的训练数据集;其次采用ESM-2模型进行进化尺度预训练,生成1280维残基级上下文嵌入;最后设计文本卷积神经网络(Text-CNN)作为微调层,通过核大小为3的64个并行过滤器捕获空间局部特征。所有实验在配备NVIDIA Tesla V100 GPU的国家蛋白质科学中心节点完成。

在模型构建部分,研究证实ESM-2在AUC(0.847)和F1(77.61%)等指标上显著优于BERT-BFD和OntoProtein模型。通过五折交叉验证发现,Text-CNN微调层以79.36%的准确率和0.59的MCC值展现最佳性能,其多尺度卷积滤波器能有效识别3-5个残基的活性位点特征。

比较实验结果更令人振奋:在P60-P90四个预分割子集上,AOP-DRL相较专用抗氧化肽模型的平均准确率提升达7.26%、2.57%、2.59%和4.20%。特别是在P90数据集上取得76.21%的ACC和0.52的MCC,证明其卓越的泛化能力。消融实验进一步验证,移除预训练模块会使性能骤降(ACC:55.52%),凸显ESM-2嵌入的关键作用。

这项研究还开发了用户友好的AOP-DRL网络服务器,支持500条肽段的批量分析和蛋白质酶解预测。平台采用Vue3前端和FastAPI后端架构,提供trypsin、pepsin等多种酶解方案的可视化结果。

在讨论环节,研究者指出ESM-2的34层Transformer架构和650M参数使其能层次化建模复杂序列-结构关系,而UniRef50数据库的5000万条进化多样性序列保证了功能域的全面覆盖。与需要长程依赖建模的跨膜肽不同,抗氧化活性主要依赖局部功能基序,这解释了Text-CNN的架构优势。

该研究的局限在于对翻译后修饰的敏感性验证不足,且Text-CNN对α-螺旋和β-折叠等非局部结构特征的解析能力有限。未来计划整合AlphaFold2结构嵌入和多组学表达谱,通过对比学习提升低丰度肽段的识别率。

这项研究通过深度表征学习框架的系统创新,为抗氧化肽的计算识别提供了高效解决方案。其理论价值在于阐明抗氧化功效对保守局部基序的结构依赖性,实践意义则体现在加速功能性食品开发和精准抗氧化疗法设计。网络服务器的开放共享将进一步推动该领域的研究进程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号