CellResDB:基于患者单细胞转录组解析癌症治疗耐药机制的创新数据库平台

【字体: 时间:2025年07月16日 来源:Communications Biology 5.2

编辑推荐:

  本研究针对癌症治疗耐药机制研究中单细胞分辨率数据资源匮乏的现状,开发了CellResDB数据库平台。研究人员整合1391例患者样本、470万单细胞数据,通过智能机器人CellResDB-Robot实现交互式分析,首次系统揭示了肿瘤微环境(TME)细胞组成与治疗响应的关联规律,为精准肿瘤学研究提供了重要资源。该成果发表于《Communications Biology》,创新性地将大语言模型(LLM)应用于生物医学数据库领域。

  

癌症治疗领域近年来虽取得显著进展,但耐药性问题始终如"达摩克利斯之剑"高悬——免疫治疗响应率仅20-40%,靶向治疗响应差异高达25-75%。这种治疗抵抗的"黑箱"背后,肿瘤微环境(TME)这个由癌细胞与非癌细胞组成的复杂生态系统扮演着关键角色。然而现有数据库要么局限于bulk RNA-seq数据,要么缺乏临床响应注释,使得科学家们难以在单细胞层面破解耐药机制。

中国的研究团队决心打破这一困境。他们历时多年打造的CellResDB数据库,如同给肿瘤研究领域装上了"细胞级显微镜"。这个迄今最全面的耐药研究资源库,汇聚了24种癌症类型、1391例患者样本的近470万个单细胞数据。通过创新的智能机器人CellResDB-Robot(基于GPT-4o架构),研究者只需用自然语言提问,就能快速获取治疗响应相关的细胞组成变化、基因表达谱等关键信息。

研究团队采用多管齐下的技术路线:从GEO等平台系统收集72个scRNA-seq数据集;运用Seurat进行统一质控(保留nFeature_RNA 200-5000、线粒体基因<10%的细胞);通过CellMarker 2.0标准化44种细胞类型注释;采用CellChat分析细胞间通讯网络;结合GSEA解析响应组(R)与非响应组(NR)的转录特征。特别开发COZI bot平台构建的智能代理系统,实现了自然语言驱动的数据挖掘。

数据库全景扫描显示惊人规模:皮肤癌数据集占比最高(30.56%),结直肠癌样本数居首(435例);PD-1抑制剂Pembrolizumab是最常用药物。通过UMAP降维可视化,研究者发现响应组呈现独特的"细胞社会结构"——调节性T细胞(Treg)和树突细胞在NR组富集,而B细胞和增殖性T细胞在R组更活跃。这种细胞组成差异在28个配对数据集的分析中得到验证(p<0.05),暗示特定免疫细胞亚群可能成为预测治疗响应的生物标志物。

智能交互系统成为研究亮点。CellResDB-Robot通过三大任务模块实现"对话式科研":任务1精准检索癌症治疗数据集,任务2解析治疗后细胞比例变化,任务3追踪特定基因表达动态。例如输入"前列腺癌相关数据集",系统能自动匹配并返回标准化分析结果。尽管LLM在精确查询时存在局限,这种将人工智能与专业数据库结合的创新尝试,为生物医学大数据分析开辟了新范式。

在分子机制层面,研究揭示耐药相关的"信号高速公路"。KEGG富集分析显示,NR组细胞中JAK-STAT和TGF-β通路显著激活;细胞通讯网络分析发现,NR组中CCL5-CCR5等配体-受体对的交流频率更高。这些发现为理解耐药提供了新的分子视角,提示联合靶向这些通路可能克服治疗抵抗。

这项发表于《Communications Biology》的研究,不仅构建了迄今最全面的癌症治疗响应单细胞图谱,更开创了智能生物医学数据库的新模式。其价值如同为抗癌研究提供了"数字孪生"平台,使科学家能以前所未有的分辨率观察治疗过程中的细胞演化。随着更多单细胞多组学数据的整合,CellResDB有望成为精准肿瘤学的"罗塞塔石碑",助力解码耐药密码、开发新型联合疗法。正如研究者所言,这既是数据资源的突破,更是研究范式的革新——当单细胞技术与人工智能相遇,抗癌战争将迎来新的"智能武器"。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号