MvDST:基于空间坐标、转录组与形态学多视图一致性的空间转录组降噪新框架
《Briefings in Bioinformatics》:Denoising spatially resolved transcriptomics with consistency of heterogeneous spatial coordinates, transcription, and morphology
【字体:
大
中
小
】
时间:2025年10月05日
来源:Briefings in Bioinformatics 7.7
编辑推荐:
本研究针对空间转录组技术数据噪声高、模态异质性大等挑战,提出了一种多视图降噪框架MvDST。该框架通过深度自编码器与对比学习整合空间坐标、基因表达谱和组织形态学特征,有效提升数据质量,在模拟与真实数据集上均显著优化了空间域识别精度与生物标志物发现能力,为复杂组织结构和疾病机制研究提供了可靠工具。
在生命科学领域,理解细胞在组织中的空间分布及其功能异质性对揭示疾病机制至关重要。传统显微镜技术依赖形态特征进行细胞分类,但效率低且难以捕捉动态状态;单细胞RNA测序虽能解析转录组信息,却丢失了空间位置。空间转录组技术的出现弥补了这一空白,它能同时获取细胞的空间坐标、基因表达数据及对应的病理图像,为研究组织架构提供了前所未有的机会。然而,由于实验流程中组织固定、mRNA捕获等技术环节的复杂性,空间转录组数据常包含大量噪声,尤其是基因表达矩阵中的“脱落事件”,严重干扰下游分析。
尽管已有部分算法尝试解决噪声问题,但它们多将降噪与特征学习分离,或未能充分整合多模态信息,导致生物信号被抑制、模态异质性处理不足。为此,西安电子科技大学等单位的研究团队在《Briefings in Bioinformatics》上发表了题为“Denoising spatially resolved transcriptomics with consistency of heterogeneous spatial coordinates, transcription, and morphology”的研究,提出了MvDST框架。该框架通过多视图一致性学习,将空间坐标、转录组和形态学数据转化为协同优化的特征,显著提升了数据质量与可解释性。
研究团队采用的核心技术方法包括:基于拉普拉斯滤波器的表达谱高频噪声过滤、ResNet50提取组织形态学特征、K近邻算法构建空间与形态相似性矩阵、双分支多层感知机编码器结合高斯扰动增强特征判别性,以及通过优化重构损失与多视图相似性矩阵差异实现跨模态一致性学习。实验数据涵盖10x Visium、STARmap、osmFISH等多平台数据集,包括人类乳腺癌组织、小鼠大脑皮层等真实样本与模拟数据。
Benchmarking multiview denoising framework for spatial transcriptomics on simulated spatially resolved data
在模拟数据中,MvDST在不同噪声方差(0–0.9)和基因脱落率下均保持最低的重构误差,其均方误差显著低于DCCA、MFLVC等基线方法。通过t-SNE可视化与调整兰德指数评估,MvDST学习到的潜在特征能清晰区分人工空间域结构,且在高噪声环境下仍保持优越的聚类鲁棒性。
Performance of various algorithms in denoising cancer spatially resolved data
在人类乳腺癌数据中,MvDST降噪后的数据显著增强了区域特异性标志基因的表达边界连续性。例如,CRISP3在肿瘤区域的表达分布更清晰,且基因表达水平在对应域内外的差异显著性提升。通过SCANPY进行空间域识别时,MvDST将ARI从原始数据的0.516提升至0.573,优于Sprod、DIST等方法。UMAP可视化与分布密度分析进一步表明,降噪后的特征能有效区分导管原位癌、浸润性导管癌等病理亚型,并揭示肿瘤边缘至核心的演化轨迹。
Performance of various algorithms in denoising normal tissues
在人类前额叶皮层数据中,MvDST降噪使层状特异性标志基因表达更显著,如C1QL2在Layer 1的表达边界明显改善。空间域识别中,ARI从0.213提升至0.624,且聚类紧凑性指标优于基线。PAGA轨迹分析显示,降噪后数据准确还原了皮层Layer 1–6与白质的层次关系。
Multiview denoising framework for spatial transcriptomics is applicable for spatially resolved data with various platforms
MvDST在STARmap、osmFISH、Stereo-seq等多平台数据中均表现优异。例如,在小鼠视觉皮层数据中,其空间域识别ARI达0.860;在4i蛋白质组数据中,降噪后亚细胞结构分辨率显著提升。标志基因共表达分析进一步验证了识别域的生物相关性。
研究结论表明,MvDST通过多视图一致性学习有效克服了空间转录组数据的噪声与异质性挑战,为组织空间架构解析和疾病机制研究提供了可靠预处理工具。其优势在于将降噪转化为特征兼容性优化问题,兼顾重构精度与特征判别力。未来工作中,整合病理基础模型或空间解卷积技术有望进一步提升临床适用性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号