EpiAgent:基于大规模预训练的单细胞染色质可及性基础模型赋能细胞状态模拟与精准注释

【字体: 时间:2025年09月26日 来源:Nature Methods 32.1

编辑推荐:

  来自国内的研究团队开发了基础模型EpiAgent,通过预训练大规模人类scATAC-seq数据集,解决了单细胞染色质可及性数据分析中的特征提取、细胞注释和数据补全等复杂任务。该模型利用双向注意力机制解析调控异质性,首次实现了cis调控元件 knockout 模拟和零样本细胞类型标注,为表观遗传调控机制研究提供了通用计算框架。

  

EpiAgent作为一种面向单细胞转座酶可及染色质测序(scATAC-seq)数据的基础模型,通过对大规模人工标注的"Human-scATAC-Corpus"进行预训练,将染色质可及性模式编码为简洁的"细胞语句"。该模型通过双向注意力机制捕捉调控网络背后的细胞异质性,在无监督特征提取、有监督细胞类型注释和数据插补等标准下游任务中表现卓越。通过整合外部嵌入表征,EpiAgent能够有效预测样本外刺激和未知遗传扰动下的细胞响应,支持参考数据整合与查询数据映射。借助对顺式调控元件(cis-regulatory elements)的计算机模拟敲除实验,该模型展现出模拟细胞状态变化的潜力,并进一步扩展至零样本(zero-shot)细胞类型直接标注能力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号