跨模态迁移学习构建的蛋白质衍生RNA语言模型ProtRNA

【字体: 时间:2025年08月23日 来源:Cell Systems 7.7

编辑推荐:

  来自Zhang等的研究人员通过跨模态迁移学习策略,将蛋白质语言模型ESM-2成功适配于RNA序列建模,开发出ProtRNA模型。该研究以仅1/8可训练参数和1/6训练数据,在RNA下游任务中达到与主流RNA语言模型相当的性能,为生物语言模型的跨模态知识迁移提供了创新范例。

  

蛋白质语言模型(Protein Language Models, PLMs)如ESM-2在生物序列分析中表现卓越,但RNA语言模型仍面临数据稀缺的挑战。Zhang团队创新性地提出ProtRNA模型,通过跨模态迁移学习策略,将ESM-2中编码的蛋白质进化信息和理化特征迁移至RNA领域。这种"降维打击"式的方法仅需基准模型1/8的可训练参数和1/6的训练数据,就在RNA二级结构预测、功能注释等下游任务中展现出媲美甚至超越专业RNA模型的性能。研究揭示了不同生物大分子间潜在的知识迁移通路,为"低资源"生物序列分析开辟了新思路。图形摘要生动展示了蛋白质语义空间向RNA特征空间的映射过程,犹如搭建起连接两种生命密码的"生物语义立交桥"。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号