Winnow-KAN:基于小基因集空间转录组学的单细胞RNA测序位置恢复新方法

【字体: 时间:2025年08月13日 来源:BMC Bioinformatics 3.3

编辑推荐:

  研究人员针对单细胞RNA测序(scRNA-seq)缺乏空间信息的问题,开发了基于改进型Kolmogorov-Arnold网络(KAN)的Winnow-KAN模型。该方法通过特征选择层筛选关键基因,仅需少量基因即可实现细胞空间定位预测,在脑组织和癌症样本中验证显示其性能优于传统多层感知器(MLP)方法,为空间转录组学研究提供了高效工具。

在生命科学研究领域,单细胞RNA测序(scRNA-seq)技术革命性地揭示了细胞异质性,但其细胞解离过程导致关键空间信息丢失,犹如获得精美拼图却丢失了拼图板。这个"空间盲区"严重阻碍了组织结构和细胞分布的研究,特别是在阿尔茨海默病(AD)等神经系统疾病研究中,神经元在脑皮层中的层状分布对认知功能至关重要。传统方法如Seurat依赖空间标记基因,但存在覆盖不全的局限;而新兴空间转录组学(ST)技术虽能保留空间信息,但高维数据带来的冗余特征和过拟合风险成为新的挑战。

加拿大麦吉尔大学(McGill University)的研究团队在《BMC Bioinformatics》发表的研究中,提出了创新解决方案Winnow-KAN。这项研究巧妙地将数学领域的Kolmogorov-Arnold表示定理应用于生物信息学,开发出能同时实现基因选择和空间预测的双功能模型。该模型通过整合B样条函数(B-spline)和ReLU激活函数,不仅提高了计算效率,还能识别对空间定位最具预测价值的基因组合,在保持精度的前提下将所需基因数量减少至传统方法的1/8。

研究采用了几项关键技术:1)基于10x Visium和MERFISH平台获取的人脑和小鼠脑空间转录组数据;2)改进型Kolmogorov-Arnold网络架构,包含特征选择层(Winnow Block)和预测层;3)针对连续坐标预测和离散区域分类的双任务设计;4)采用CORAL损失函数处理皮层数据的序数特性;5)通过权重分析识别空间信息基因。

在层状结构恢复方面,研究使用LIBD人类前额叶皮层数据集验证模型性能。Winnow-KAN在测试样本151676上取得74.99%的top-1准确率和96.53%的top-2准确率,显著优于传统方法。值得注意的是,当基因数量从1425个减少到166个时,性能仅轻微下降,证明其强大的特征选择能力。模型识别出MAPK10、MIF等与AD病理相关但差异表达不显著的基因,为神经退行性疾病研究提供了新线索。

在二维坐标预测任务中,MERFISH小鼠脑数据测试显示,Winnow-KAN仅需10个基因即可达到0.49的皮尔逊相关系数,远高于SPARK方法(0.28)。空间可视化证实预测细胞位置与真实分布高度吻合,特别是在少突胶质细胞富集的WM区域表现优异。基因重要性分析揭示,模型自动筛选的基因具有明确的空间表达模式,如皮质层特异性基因SHANK3和分子伴侣HSP90AA1。

跨数据集验证突显了模型的实用价值。在来自不同研究中心的三组AD患者前额叶皮层scRNA-seq数据中,Winnow-KAN无需重新训练即可获得一致的层状分布预测:兴奋性神经元主要分布于L2-L5层,少突胶质细胞集中在L6和WM区域,与已知生物学特征相符。这种"一次训练,多次应用"的特性解决了现有方法如Tangram需重复计算的瓶颈。

该研究的创新性体现在三个层面:方法论上,首次将KAN网络引入空间转录组学,通过权重冗余设计实现隐式稀疏化;技术上,改进的网格更新算法和激活函数集成增强了训练稳定性;应用上,开发出兼顾预测性能和解释性的双阶段框架。特别有价值的是,模型筛选的基因与传统差异表达分析结果仅有16个重叠,提示其能捕捉常规方法忽略的空间信息载体。

在讨论部分,作者客观分析了当前局限:坐标预测受限于样本特异性,未来需结合组织配准技术;对小样本层别(如L4)的识别需损失函数加权处理。这些思考为后续研究指明方向,包括整合组织学特征处理肿瘤异质性样本,以及探索基因共调控网络。

这项研究的意义超越方法学创新,为空间组学研究范式带来重要转变:从"越多基因越好"到"精准基因选择",从"黑箱预测"到"可解释建模"。正如识别城市地标即可定位,而非记忆全部街景,Winnow-KAN证明精准空间解码可能只需少量关键基因。这种高效简约的策略,特别适合临床样本分析等基因覆盖受限场景,为单细胞技术在精准医学中的应用开辟了新途径。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号