
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多重成像数据中细胞计数的统计建模与分析:空间模式与分布参数的关联研究
【字体: 大 中 小 】 时间:2025年05月30日 来源:Cell Systems 9.0
编辑推荐:
(编辑推荐)本研究开发了负二项分布和β二项分布两种统计模型,精准描述多重成像技术(IMC)中细胞计数的分布特征,揭示了细胞空间模式与分布参数的关联性。相比传统非参数秩检验,基于分布参数的统计检验显著提升差异丰度检测功效,并提出分层采样策略解决高度聚集细胞表型的分析难题,为空间组学研究提供新方法学框架。
高效的数据分析依赖于对数据特性的准确理解。多重成像技术的快速发展使得健康与肿瘤组织的空间图谱绘制成为可能,但缺乏合适的统计模型来比较不同样本组间的组织组成差异。本研究针对成像质谱流式(IMC)数据,开发了两种统计模型来描述细胞计数的分布特征,其参数直接关联视野(FoV)大小和细胞特性(如密度和空间聚集性),显著提升了差异丰度检验的统计功效。
• 组织中的细胞计数可用负二项或β二项分布建模
• 分布参数取决于FoV大小和细胞类型的空间模式
• 基于这些分布的差异丰度检验提高了统计功效
通过分析健康人淋巴结的IMC数据集,对17种细胞表型的计数数据进行泊松、负二项和β二项分布拟合。负二项分布参数μ与FoV面积呈比例关系,而过度离散参数θ和φ与FoV宽度呈线性相关。空间聚集程度(通过Clark-Evans指数衡量)与θ参数显著正相关,验证了过度离散参数可作为空间聚集的量化指标。
两种模型完美预测了细胞表型恢复概率,并保持FoV宽度与τ参数的幂律关系。通过负二项模型可精确计算检测特定稀有细胞表型所需的最优实验设计,为实验规划提供理论依据。
与Wilcoxon秩检验相比,负二项和β二项模型构建的似然比检验和Wald检验显著提高统计功效。对于空间聚集的细胞表型(如活化B细胞),β二项检验的灵敏度比秩检验高2倍。统计功效主要受细胞空间模式而非密度驱动,高度聚集的细胞表型需要更多FoV样本。
基于CD20或CD45标记的空间分层采样策略,将B细胞表型的估计方差降低16倍以上。Neyman最优分层采样虽引入轻微偏差,但显著提升高度聚集细胞表型的检测稳健性。不同分层标记的效果具有细胞表型特异性,需根据研究目标定制。
在甲状腺样本中验证了FoV宽度与分布参数的线性关系。通过功率分析确定,检测免疫细胞浸润差异仅需3-18个FoV,而传统秩检验需要更多样本。绝对log2倍数变化是决定所需样本量的关键因素。
本研究建立的统计模型将细胞空间模式与分布参数直接关联,克服了传统非参数检验功效不足的缺陷。提出的分层采样策略为临床样本有限的研究提供解决方案。未来需拓展该方法至空间转录组数据,并探索其在生存分析和细胞互作研究中的应用潜力。该框架有望推动多重成像技术在临床常规中的应用,为复杂疾病的精准解析提供新工具。
生物通微信公众号
知名企业招聘