编辑推荐:
本文介绍一种整合计算与实验的方法(CellCartographer)筛选转录因子(TFs)用于细胞命运工程。利用染色质可及性和转录组数据设计 TF 组合筛选,从诱导多能干细胞(iPSCs)高效分化出 12 种细胞类型,6 种经迭代优化后 6 天内完成高效率分化,为细胞治疗提供新策略。
研究背景与方法开发
诱导多能干细胞(iPSCs)的出现为细胞功能与分化研究提供了新途径,转录因子(TFs)过表达是快速诱导分化的有效方法,但筛选合适 TF 组合极具挑战。研究开发了名为 CellCartographer 的机器学习(ML)流程,结合染色质可及性(如 ATAC-seq、DNase-seq)和转录组(RNA-seq)数据,设计 TF 组合的 pooled-screening 实验,并通过迭代优化提升分化效率。该方法利用染色质可及性推断 TF 结合位点,结合转录水平排除不表达的 TF,从人类 TFome(1732 个 TFs)中筛选候选因子。
计算模型构建与验证
CellCartographer 通过三步计算策略确定候选 TFs:首先利用染色质可及性数据训练逻辑回归模型,通过 LASSO 正则化筛选与开放染色质正相关的 TF 结合基序;然后通过多细胞类型数据排除组成型激活的 TF(平均 Z 评分≥2.5);最后结合目标细胞表达数据确定候选 TF 列表。在 33 种细胞类型的分析中,该模型筛选的 TF 基因能有效聚类相似细胞类型,且与全转录组聚类结果高度一致。与其他 9 种 TF 预测工具(如 DREME、Homer、GarNet)相比,CellCartographer 在 7 种细胞类型中均能回收至少一个已知先驱 TF,表现出较强的竞争力。
多细胞类型的筛选与迭代优化
研究针对来自三个胚层的 12 种细胞类型(如调节性 T 细胞 iTregs、细胞毒性 T 细胞 iCytoTs、肝细胞 iHeps、II 型星形胶质细胞 iAstIIs 等)设计 TF 组合,通过初级筛选获得低效率分化细胞(0.05%-17.64% 阳性率),随后对 6 种高临床相关性细胞类型进行迭代优化。通过条形码测序分析 TF 丰度,设计精炼 TF 池(≤5 个 TF / 池),结合稳定细胞系构建与克隆筛选,最终在 6 天内实现 4 种细胞类型的近完全分化(如 iAstIIs、iHeps 分化效率超 50%)。克隆细胞系的 RNA-seq 分析显示,其转录组特征与目标细胞高度相似,且富集特定细胞类型的基因本体(GO)术语。
功能验证与性能对比
对 iAstIIs、iHeps、iTregs 和 iCytoTs 进行功能验证:iAstIIs 对 ATP、谷氨酸刺激表现出典型钙信号响应,证明其神经胶质细胞功能;iHeps 在肝毒素(如对乙酰氨基酚、尼法唑酮)处理下的存活率与原代肝细胞相似,并能再现磷脂沉积症表型;iTregs 可抑制效应 T 细胞增殖,iCytoTs 经激活后表现出增殖能力。与现有方法相比,该策略显著缩短分化时间(6 天 vs. 传统方法数周),减少分化阶段,尤其在 T 细胞分化中优势明显。
讨论与展望
CellCartographer 整合计算与实验,首次实现迭代 ML 驱动的 TF 组合筛选,具有物种通用性(如利用小鼠数据筛选人类 iTregs 相关 TF)和低数据依赖等优势,为缺乏数据的细胞类型工程提供了可能。研究首次报道 iAstIIs、iTregs、iCytoTs 的 TF 组合,证明 TF 过表达可快速驱动高效分化。尽管存在表面标志物依赖和培养基优化等局限性,该方法仍为细胞治疗、疾病建模和药物开发提供了强大工具,有望加速功能性细胞系的工程化应用。