
-
生物通官微
陪你抓住生命科技
跳动的脉搏
空间形态蛋白质组学特征预测组织架构中的疾病状态:基于图神经网络的SNOWFLAKE算法解析免疫微环境
【字体: 大 中 小 】 时间:2025年08月10日 来源:iScience 4.1
编辑推荐:
本研究针对免疫细胞在组织微环境中的空间组织机制这一关键问题,开发了SNOWFLAKE图神经网络框架,整合单细胞蛋白表达(CD20/CD21/Ki67等)与形态学特征,成功预测COVID-19感染状态(AUC 0.973)。该技术突破传统机器学习局限,首次实现从淋巴滤泡空间结构中提取可解释的亚图生物标志物,为肿瘤免疫微环境研究提供新范式。
免疫系统如何通过细胞的空间排布来响应疾病?这个看似简单的问题背后,隐藏着组织微环境的高度复杂性。就像雪花形成过程中受温度、湿度等参数影响会产生独特晶体结构一样,淋巴滤泡中的生发中心(Germinal Center, GC)也会因抗原刺激形成特征性空间构象。然而,传统技术难以量化这种多维度的空间-蛋白关联,阻碍了人们对感染和肿瘤免疫微环境的深入理解。
针对这一挑战,美国佐治亚理工学院与埃默里大学Wallace H. Coulter生物医学工程系的Thomas Hu、Efe Ozturk等研究者,在《iScience》发表了突破性研究。他们开发的SNOWFLAKE(Spatial Single-cell Organization With Formation LeArning and Knowledge Embedding)算法,首次将图神经网络(Graph Neural Network, GNN)与形态计量学(MorphPCA)相结合,通过分析8,879,749个单细胞的空间-蛋白特征,实现了从组织架构预测疾病状态的创新突破。研究团队利用5折交叉验证证实,该模型在儿科COVID-19数据集上的预测AUC达0.973,显著优于随机森林(0.808)等传统方法。
关键技术包括:1)基于接触网络的单细胞空间图构建;2)Procrustes对齐的滤泡形态PCA降维;3)位置感知的图注意力网络(GAT)融合边缘距离/角度特征;4)集成梯度(IG)和GNNExplainer的可解释亚图提取。研究队列涵盖NIH提供的12例儿童扁桃体/腺样体样本(6例COVID-19康复者),并通过IMC和CODEX技术验证了在乳腺癌(518例)和结直肠癌TLS(18例)中的普适性。
SNOWFLAKE整合形态学和蛋白质标记物通过图神经网络
研究团队发现,将滤泡形态主成分(如GC_SM_1)与CD21+滤泡树突细胞(FDC)表达关联后,模型能捕捉生发中心的结构变异。通过MorphPCA提取的16个主成分可解释95%形态变异,其中与B细胞迁移相关的CCR7/CCL19轴空间模式在COVID-19阳性样本中显著改变。
位置感知SNOWFLAKE提供可解释的边缘和节点归因
创新性地将极坐标转换融入图边缘特征后,模型可定位关键相互作用。如图2所示,COVID-19阳性样本中Ki67+ B细胞与CD68+巨噬细胞的连接权重更高(p<0.001),而阴性样本则以CD21+ FDC网络为主导。这种空间模式通过亚图聚类(Subgraph Cluster, SC)量化后,发现SC6(FDC-Ki67+ B细胞互作)对阳性预测贡献率达87.2%。
亚图聚类揭示与感染和生存相关的空间基序
从14,480个高权重亚图中识别出16种空间基序,其中SC10(Ki67+ B细胞富集)在COVID-19组出现频率是对照组的2.3倍(p=0.002)。而在乳腺癌IMC数据中,ER+肿瘤特有的EpCAM+细胞-胶原纤维空间模式,使GAT模型的预测AUC提升至0.938。
讨论与展望
该研究开创性地证明:1)淋巴滤泡的空间拓扑结构携带疾病特异性信息;2)亚图水平的生物标志物比整体表达更具预测力(如CD4+ T细胞空间网络对生存期的预测优于单纯表达量);3)算法在跨组织(腺样体/乳腺/结直肠癌)应用中保持稳健性。局限性在于当前标记物面板(10-plex)未能覆盖全部免疫亚群,且样本量较小。未来结合空间转录组和更大队列,有望揭示更精细的免疫-基质互作机制。这项技术对疫苗研发和肿瘤免疫治疗评估具有重要转化价值,其开源代码(GitHub: coskunlab/Snowflake)将推动空间组学领域的算法创新。
生物通微信公众号
知名企业招聘