
-
生物通官微
陪你抓住生命科技
跳动的脉搏
跨模态迁移学习构建的蛋白质衍生RNA语言模型ProtRNA
【字体: 大 中 小 】 时间:2025年08月23日 来源:Cell Systems 7.7
编辑推荐:
来自Zhang等的研究人员通过跨模态迁移学习策略,将蛋白质语言模型ESM-2成功适配于RNA序列建模,开发出ProtRNA模型。该研究以仅1/8可训练参数和1/6训练数据,在RNA下游任务中达到与主流RNA语言模型相当的性能,为生物语言模型的跨模态知识迁移提供了创新范例。
蛋白质语言模型(Protein Language Models, PLMs)如ESM-2在生物序列分析中表现卓越,但RNA语言模型仍面临数据稀缺的挑战。Zhang团队创新性地提出ProtRNA模型,通过跨模态迁移学习策略,将ESM-2中编码的蛋白质进化信息和理化特征迁移至RNA领域。这种"降维打击"式的方法仅需基准模型1/8的可训练参数和1/6的训练数据,就在RNA二级结构预测、功能注释等下游任务中展现出媲美甚至超越专业RNA模型的性能。研究揭示了不同生物大分子间潜在的知识迁移通路,为"低资源"生物序列分析开辟了新思路。图形摘要生动展示了蛋白质语义空间向RNA特征空间的映射过程,犹如搭建起连接两种生命密码的"生物语义立交桥"。
生物通微信公众号
知名企业招聘