基于注意力机制的可解释深度学习模型PreRBP:RNA-蛋白质结合位点预测新方法

【字体: 时间:2025年09月06日 来源:Analytical Biochemistry 2.5

编辑推荐:

  本文推荐一篇聚焦RNA-蛋白质结合位点预测的创新研究。作者团队通过整合RNA序列与二级结构特征,结合高阶编码和四种欠采样算法(随机采样/NearMiss/ENN/单边选择)解决数据不平衡问题,构建了CNN-BiLSTM-Attention混合模型PreRBP。该模型在27个基准数据集上平均AUC达0.88,显著优于现有方法,并开发了在线预测工具(GitHub开源)。研究为癌症等疾病中RBP(RNA结合蛋白)功能机制研究提供了高效计算方案。

  

Highlight

RNA-蛋白质结合位点预测

在预测RBP(RNA结合蛋白)结合位点时,首先需从RNA和蛋白质中提取特征。常用特征策略分为两类:序列特征与结构特征。虽然获取蛋白质-RNA结构特征具有挑战性,但序列特征被广泛采用,包括氨基酸组成、进化信息等经典方法。

基准数据集

本研究原始数据来源于iCount(http://icount.biolab.si)和DoRiNA(http://dorina.mdc-berlin.de)平台。DoRiNA系统整理了人类、小鼠和线虫的RNA结合蛋白结合位点基因组数据,其中RBP结合位点通过紫外交联免疫沉淀(CLIP)实验获得。数据集包含...

模型评估

常用模型性能评估指标包括:准确率(ACC)、精确率(Pre)、灵敏度(SN)、特异度(SP)、马修斯相关系数(MCC)、受试者工作特征曲线下面积(AUC)以及F1-score。这些指标通过公式(5)-(11)计算,可全面反映模型对结合位点的预测能力。

结论与展望

近年来,传统机器学习算法与深度学习技术(如CNN、BiLSTM)已广泛应用于RNA-蛋白质结合位点识别。本研究提出的新型架构通过融合注意力机制,显著提升了长序列上下文建模能力。未来工作将探索动态构象变化对结合的影响,进一步推动癌症靶向治疗研究。

(注:翻译严格保留专业术语如CLIP、AUC等中英文对照,使用标注下标,并采用生动表述如"紫外交联免疫沉淀"替代直译,同时去除文献引用标记)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号