CellMinerCDB 2.2:患者源性癌细胞系药物基因组学跨数据库探索平台的升级与临床应用
《Nucleic Acids Research》:CellMiner cross-database (CellMinerCDB) version 2.2 for explorations of patient-derived cancer cell line pharmacogenomics
【字体:
大
中
小
】
时间:2025年11月29日
来源:Nucleic Acids Research 13.1
编辑推荐:
本刊推荐:为解决癌症细胞系药物基因组学数据分散、分析门槛高的问题,研究人员开展了CellMinerCDB 2.2数据库的升级研究。该平台整合了NCI、DepMap、GDSC、MCLP、NCATS等机构的1916种细胞系和2.5万种药物数据,新增组蛋白修饰(H3K4me3/H3K27ac)、PRISM药物重筛选等模块,通过多变量LASSO模型实现了药物活性与生物标志物的关联分析(如PIK3CG-NVP-BGT226相关性验证),为肿瘤精准治疗和药物重定位提供了重要资源。
在癌症研究领域,患者源性癌细胞系一直是探索肿瘤生物学特性、药物反应机制和耐药性的重要模型。然而,随着高通量技术的快速发展,各研究机构产生了海量的药物基因组学数据,这些数据分散在不同平台且格式各异,使得研究人员在进行跨数据集分析时面临巨大挑战。特别是对于缺乏生物信息学背景的研究人员而言,如何有效整合和利用这些数据成为制约转化医学研究的瓶颈问题。
为此,美国国家癌症研究所(NCI)的研究团队在《Nucleic Acids Research》上发表了CellMiner跨数据库(CellMinerCDB)2.2版本的升级研究。该平台作为一个交互式应用程序,旨在无需大量编程经验即可直接访问和探索癌细胞系药物基因组学数据。
为了构建这一平台,研究团队采用了多项关键技术方法:基于R Shiny框架开发交互式网络应用,整合来自NCI-60、Broad DepMap、Sanger GDSC、MD Anderson MCLP和NCATS等机构的1916种癌细胞系的多组学数据(包括转录组、表观基因组、蛋白质组);建立标准化标识符映射系统(使用Cellosaurus细胞系标识和PubChem化合物标识);开发多变量LASSO回归分析模块;引入DNA条形码技术(PRISM平台)进行高效药物筛选;并整合TumorComparer计算的肿瘤样本相似性评分。
新版CellMinerCDB将细胞系数量从约1400个扩展到1916个,药物数量超过25000种,特别是增加了来自Broad PRISM、NCATS和NCI的新药重定位数据集。值得注意的是,NCATS和PRISM数据集中分别包含19%和27%的非肿瘤药物,为抗癌药物重定位研究提供了宝贵资源。
平台在数据测量方法上也实现了重要突破。大多数数据集的药物活性通过三磷酸腺苷(ATP)水平(CellTiter-Glo法)测定,而新NCI数据集(NCI-60和小细胞肺癌)使用总蛋白(磺基罗丹明B法)测定,PRISM则采用DNA条形码方法。这种多方法学的整合使研究人员能够比较不同检测协议之间的可重复性。
在功能方面,CellMinerCDB 2.2引入了层次化组织类型选择、细胞系/药物搜索高亮、多基因签名列表等新功能。特别值得一提的是新增加的细胞系和药物信息页面,如图4所示,用户可以快速查看特定细胞系(如MCF-7)或药物(如Veliparib)在所有数据集中的数据可用性。
研究团队通过多个应用案例展示了平台的实用价值。在药物-靶点相关性分析中,发现PIK3CG(磷酸肌醇3-激酶γ催化亚基)表达与抗癌药物NVP-BGT226(靶向PIK3CG和mTOR蛋白)的敏感性显著相关,尤其在白血病和淋巴瘤细胞系中表达水平较高,提示这些肿瘤类型可能对该药物更敏感。
在多变量分析方面,研究团队以消毒剂龙胆紫为响应变量,成功验证了TNFRSF1A(肿瘤坏死因子受体超家族成员1A)、NR3C1(核受体亚家族3C组成员1)和ICAM2(细胞间粘附分子2)三个基因的组合能够显著预测药物活性(p=1.3×10-10),优于任何单一基因的预测效果。
新整合的组蛋白修饰数据为研究表观遗传调控机制提供了新视角。研究发现CDH1(E-钙粘蛋白)转录表达与H3K4三甲基化(H3K4me3)和H3K27乙酰化(H3K27ac)两种转录激活标志存在显著关联,多元回归分析显示这两种组蛋白修饰共同提供了比单一修饰更好的预测效果。
研究还展示了多基因签名在癌症研究中的价值。利用18基因复制应激(RepStress)签名作为响应变量,结合四个DNA损伤反应或复制相关基因的表达,建立了高精度的预测模型,为ATR(共济失调毛细血管扩张症和Rad3相关蛋白)抑制剂等药物的应用提供了生物标志物。
CellMinerCDB 2.2的发布标志着癌症药物基因组学资源整合的重要进展。该平台不仅解决了数据分散和分析门槛高的问题,还通过引入新的数据模态和分析工具,为癌症生物学研究和精准医疗提供了强大支持。特别是其对非肿瘤药物的整合,为药物重定位研究开辟了新途径。随着人工智能技术的发展,该平台有望进一步整合大型语言模型等先进技术,提升数据分析和可视化能力,推动癌症研究向更精准、高效的方向发展。
平台的所有软件均为开源提供,研究人员可通过GitHub获取源代码,并通过Zenodo下载数据包。这种开放科学的方法有助于促进更广泛的研究合作和创新,最终加速抗癌药物的发现和开发进程。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号