
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于注意力机制的可解释深度学习模型PreRBP:RNA-蛋白质结合位点预测新方法
【字体: 大 中 小 】 时间:2025年09月06日 来源:Analytical Biochemistry 2.5
编辑推荐:
本文推荐一篇聚焦RNA-蛋白质结合位点预测的创新研究。作者团队通过整合RNA序列与二级结构特征,结合高阶编码和四种欠采样算法(随机采样/NearMiss/ENN/单边选择)解决数据不平衡问题,构建了CNN-BiLSTM-Attention混合模型PreRBP。该模型在27个基准数据集上平均AUC达0.88,显著优于现有方法,并开发了在线预测工具(GitHub开源)。研究为癌症等疾病中RBP(RNA结合蛋白)功能机制研究提供了高效计算方案。
Highlight
RNA-蛋白质结合位点预测
在预测RBP(RNA结合蛋白)结合位点时,首先需从RNA和蛋白质中提取特征。常用特征策略分为两类:序列特征与结构特征。虽然获取蛋白质-RNA结构特征具有挑战性,但序列特征被广泛采用,包括氨基酸组成、进化信息等经典方法。
基准数据集
本研究原始数据来源于iCount(http://icount.biolab.si)和DoRiNA(http://dorina.mdc-berlin.de)平台。DoRiNA系统整理了人类、小鼠和线虫的RNA结合蛋白结合位点基因组数据,其中RBP结合位点通过紫外交联免疫沉淀(CLIP)实验获得。数据集包含...
模型评估
常用模型性能评估指标包括:准确率(ACC)、精确率(Pre)、灵敏度(SN)、特异度(SP)、马修斯相关系数(MCC)、受试者工作特征曲线下面积(AUC)以及F1-score。这些指标通过公式(5)-(11)计算,可全面反映模型对结合位点的预测能力。
结论与展望
近年来,传统机器学习算法与深度学习技术(如CNN、BiLSTM)已广泛应用于RNA-蛋白质结合位点识别。本研究提出的新型架构通过融合注意力机制,显著提升了长序列上下文建模能力。未来工作将探索动态构象变化对结合的影响,进一步推动癌症靶向治疗研究。
(注:翻译严格保留专业术语如CLIP、AUC等中英文对照,使用标注下标,并采用生动表述如"紫外交联免疫沉淀"替代直译,同时去除文献引用标记)
生物通微信公众号
知名企业招聘