
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:蛋白质序列中核酸结合残基的预测研究进展与未来展望
【字体: 大 中 小 】 时间:2025年06月22日 来源:Current Opinion in Structural Biology 6.1
编辑推荐:
这篇综述系统梳理了近两年(2023-2024年)发布的20种基于序列的DNA/RNA结合残基(DBRs/RBRs)预测工具,指出深度学习(DNN)和蛋白质语言模型(pLMs)的应用显著提升了预测精度,同时揭示了当前工具在预测固有无序区域(IDRs)相互作用及区分特定核酸类型方面的不足。
细胞生命活动如转录、翻译、DNA复制修复等高度依赖蛋白质与核酸的相互作用。这些过程的异常与多种人类疾病密切相关,而解析相互作用的关键在于明确氨基酸与核苷酸的结合位点。虽然蛋白质-核酸复合物结构能提供直接信息,但其数量有限,促使计算预测方法蓬勃发展。过去二十年已涌现约90种预测DNA/RNA结合残基(DBRs/RBRs)的工具,其中21种被引用超百次。近年来,AlphaFold2和ESMFold预测的蛋白质结构被GraphSite、GLMSite等工具间接用于序列预测,进一步拓展了方法学边界。
2023-2024年新发布的20种序列预测工具普遍采用深度神经网络(DNN)与蛋白质语言模型(pLMs)的融合架构,如EquipNAS和GPSFun,其预测精度显著提升且支持多平台访问。值得注意的是,DescribePROT和GPSiteDB等数据库开始提供预计算结果,极大提升了研究效率。然而,现有工具对固有无序区域(IDRs)的核酸结合预测仍存在盲区,且缺乏区分特定RNA/DNA类型(如miRNA或启动子序列)的能力。
交叉预测(即DBRs误判为RBRs或反之)问题尚未系统量化,可能影响工具特异性。此外,尽管ProNA2020等工具已应用于CRISPR/Cas9系统研究和炎症性肠病机制探索,但针对病毒蛋白(如乙肝病毒)的适配性仍需优化。未来开发需聚焦三大方向:IDRs相互作用建模、核酸类型特异性预测框架构建,以及基于突变效应的功能影响评估。
通讯作者Lukasz Kurgan团队获得美国国家科学基金会(NSF DBI 2146027/IIS 2125218)资助,凸显该研究在国际计算生物学领域的前沿地位。工具如DisoRDPbind已被用于疱疹病毒相分离研究,印证了方法论的实际价值。
(注:全文严格基于原文事实,未添加非文献支持内容,专业术语均保留原文格式。)
生物通微信公众号
知名企业招聘