呼吸系统的空间转录组学

《Annual Review of Physiology》:Spatial Transcriptomics of the Respiratory System

【字体: 时间:2025年08月12日 来源:Annual Review of Physiology 19.1

编辑推荐:

  单细胞基因组学揭示了肺和气道细胞类型的异质性与可塑性,但三维空间互作机制尚未明确。新型空间转录组学技术(如Visium、STOmics)结合计算工具(机器学习、深度学习)可解析细胞类型分布及信号通路,在肺发育、COVID-19、肺癌和肺纤维化中已发现关键分子特征及细胞互作模式。未来需整合多组学数据并提升三维分辨率,以推动精准诊疗发展。

  近年来,随着单细胞基因组学技术的迅速发展,我们对肺部和气道中细胞类型异质性和可塑性的理解取得了显著进展。然而,现在面临的挑战是如何在三维空间中理解这些细胞类型之间的相互作用,以实现肺功能的正常运作,包括维持气流和气体交换,同时防止感染。为了解决这一问题,新型空间解析基因表达技术的迅速崛起,以及结合机器学习和深度学习的计算工具,为这一挑战提供了新的希望。本文将回顾最常用的空间分析流程,探讨其优势与局限性,并概述机器学习和人工智能在提升空间数据解读方面的最新进展。这些技术有望彻底改变我们对呼吸系统在健康与疾病状态下的理解,并展示在肺发育、新冠状病毒(COVID-19)、肺癌和肺纤维化等领域的研究成果。

呼吸系统需要持续向血液中输送氧气,同时还要防御病原体的侵袭。鉴于这些关键功能,呼吸道疾病是导致发病率的重要因素之一,其中哮喘和慢性阻塞性肺疾病(COPD)是最常见的两种(1)。环境污染物,尤其是吸入烟草烟雾,可能会损伤肺部并导致肺癌,而肺癌每年导致的死亡人数超过其他任何癌症(2)。此外,新冠状病毒的全球大流行也凸显了呼吸道感染的严重性。因此,呼吸生物学的核心目标是理解健康肺部的功能,识别疾病背后的改变,并启发针对肺部疾病的治疗方法。

呼吸系统的复杂组织结构由上呼吸道和下呼吸道的分支结构组成,最终通向肺泡,肺泡中相邻的特化上皮细胞和血管细胞有助于气体交换。在气道中,仅仅半厘米的气管组织可能包含数十种交织在一起的细胞类型,从上皮细胞到血管、神经和免疫细胞,以及支持组织如平滑肌(3)。为了理解这种复杂组织结构如何维持健康的肺部生理功能,我们需要对组成细胞类型进行分类,明确其位置以及它们之间的相互作用。近年来,单细胞RNA测序(scRNA-seq)技术的突破使得我们能够生成肺部的单细胞图谱(4–10),这些图谱不仅为已知细胞类型提供了分子定义,还揭示了新的细胞群体,如离子细胞,并为细胞状态的异质性和可塑性提供了深刻见解。

这些研究已被整合到诸如人类肺细胞图谱(HLCA)(11)等项目中,而肺部图谱联盟(LungMAP)则开发了数据浏览器(13)和细胞数据库(CellCards)(14)等工具。这些宝贵资源推动了对呼吸系统组织基本构成的进一步发现。然而,尽管有了这些进展,我们对肺部组织结构的认知仍然存在显著空白,包括细胞类型的空间关系定义、它们如何相互作用,以及在疾病中组织结构和细胞间相互作用的变化。

新型空间转录组学技术的发展现在有望解决这些挑战。这些工具允许我们研究完整组织切片的细胞组成,通过单次实验检测数百到数千个基因,甚至提供全转录组数据。然而,为了充分实现这些技术的潜力,需要技术开发者、生物信息学家、临床医生和生物学家等多学科团队的合作,相互学习并结合各自的专长。为此,本文将回顾最具前景的空间技术,概述实验和计算流程,突出未来可能的进步领域,并展示这些技术如何已经在肺部生物学中带来新的见解。

在空间基因表达领域,快速的技术发展带来了众多可用的方法(最近在15–18中进行了综述)。所有这些方法都需要将保存的组织切片放在载玻片上,然后从载玻片上捕获和条码化RNA或直接在原位标记。形态学在这些技术中起着重要作用:新鲜冷冻技术在保持完整RNA方面具有优势,但脆弱的结构如肺实质容易受损。相反,福尔马林固定石蜡包埋(FFPE)技术能更好地保留组织形态,但会破坏和交联RNA,使其断裂。因此,在选择最合适的检测方法时,需要考虑样本的制备过程。样品的物理大小和细胞复杂性、所需的额外染色(如苏木精-伊红(H&E)或免疫荧光)以及需要检测的基因数量都是重要的因素。空间检测方法通常分为基于测序的方法,这些方法通常具有全转录组范围但分辨率较低,或者基于成像的方法,这些方法使用探针和显微镜来检测选定的转录物,具有更高的分辨率。

基于测序的空间技术(如Visium)依赖于在固体支持物上绑定空间条码捕获序列,并生成测序文库作为输出。例如,Visium使用寡聚体-dT捕获序列在玻璃载玻片上打印成斑点,每个斑点都有一个独特的条码,通过测序读取。大多数这些方法只需要标准的实验室设备,除了CytAssist和GeoMx(19)协议。它们在起始材料、分辨率和视野范围方面有所不同。大多数方法需要新鲜冷冻的组织以捕获完整的RNA用于逆转录(RT)并产生全转录组读数。虽然标准做法是使用完整的互补DNA(cDNA)生成短读测序文库以计数转录物的3′端,但Visium已展示出长读测序的能力,这使得捕获不同的剪接异构体成为可能。

然而,基于RT的方法在固定样本中表现不佳,因为大多数固定剂会交联RNA,使其断裂。能够使用FFPE样本将打开对诸如肺部等器官的高质量形态学研究,以及对历史生物样本库的访问,因为FFPE组织在室温下可以稳定保存多年。这已被Visium FFPE和Visium HD的发布所解决,它们使用针对全转录组的探针而非依赖逆转录,以及Nanostring的GeoMx使用光裂解探针。基于探针的方法通常更敏感,能检测到每个斑点中更多的基因,但缺乏cDNA生成使得它们不够灵活:无法进行长读测序或放大感兴趣的目标序列(如免疫T细胞和B细胞受体(TCR和BCR)序列以评估克隆性)。

基于探针的检测方法的一个实际优势是无需优化组织通透时间。这是一个在Visium、STOmics和BMK S1000中需要的繁琐且主观的过程,目的是最大化RNA产量同时限制横向扩散,这会降低空间分辨率。Curio则通过不固定或通透组织,而是依赖于新鲜切片表面的RNA扩散来避免这一步骤,但这种方法在某些组织中可能导致cDNA产量较低。

空间转录组学领域的一个主要驱动力是实现单细胞分辨率,以解析由数十种不同细胞类型组成的复杂组织结构。Visium使用直径为55微米的寡聚体-dT斑点,这些斑点覆盖多个细胞,这限制了对复杂结构的分析,需要使用计算方法结合scRNA-seq数据进行解卷积(见下一部分中的计算任务3)。然而,Visium已被证明是稳健且受欢迎的,提供了关于组织微环境的重要信息。新兴的方法正在努力解决分辨率问题,如BMKManu S1000、Curio、Slide-seq v2(22、23)、Visium HD和STOmics(Stereo-seq)(22),它们分别具有4.8微米、10微米、2微米和500纳米的分辨率,这通过使用微珠(BMKManu和Curio)、连续的寡聚体草坪(Visium HD)或带条码的DNA纳米球(STOmics)来捕获信使RNA(mRNA)实现。值得注意的预商业方法包括Seq-Scope(24)和Pixel-seq(24、25),它们分别使用DNA簇或polonies进行捕获。最后,DBiT-seq(26、27)使用网格化垫片将组织切片分成10微米2的独立反应室。关于方法的概述,见图1。微流控系统如DBiT-seq允许用户按需流动试剂,这为新的多组学检测方法打开了大门。确实,空间多组学领域正在迅速发展,将允许更丰富的组织身份描述,如在其他地方详细讨论的(28)。

追求更高分辨率也带来了其自身的挑战。斑点/微珠/簇的尺寸越小,每个斑点能结合的转录物就越少,数据就越稀疏。因此,通常需要将多个斑点/微珠/簇结合以生成可用信号。例如,Stereo-seq使用200纳米的DNA纳米球池来产生25微米直径的区域。更高的分辨率意味着需要更大的测序深度来实现良好的基因覆盖,因此成本也更高。然而,这些方法首次提供了在全转录组尺度上解析复杂细胞架构的前景,实现了真正的单细胞空间分辨率。

那么,仅生成组织的基因表达图谱是否足够?与H&E染色的兼容性极其重要,因为这种方法用于识别组织结构和病理变化,极大地有助于数据解释。免疫荧光染色也可以用于可视化特定的蛋白质标记或细胞边界。事实上,随着空间技术的分辨率提高,改进细胞分割方法的需求变得更加迫切,以便准确解卷积单细胞数据;这些方法得到了染色方法的有力支持。这不仅是一个空间生物学测序分支的挑战,也是成像领域的挑战。

基于成像的空间转录组学方法通过探针结合RNA并用荧光读取。与基于测序的方法相比,这些方法需要更复杂的显微镜或染色仪器。它们在起始材料方面较为灵活,可以使用新鲜冷冻或FFPE组织,并且不需要等待文库制备或测序即可提供数据。两个关键优势是亚细胞分辨率和高灵敏度,允许检测单个RNA分子。然而,这种优势是以可检测的总转录物数量为代价的。

市场上的第一种空间检测方法是RNAscope(29),这是一种基于原位杂交的方法,用于检测1–4个基因(或在较低灵敏度下检测12个基因)。这种方法非常受欢迎,因为其相对低成本、易用性、高灵敏度,以及能够检测不同丰度的转录物,且支持自动化运行。它已被优化用于诊断和临床使用,以及研究。然而,随着scRNA-seq和细胞图谱的发展,高通量的商业方法如Molecular Cartography(30)、Xenium(31、32)、MERSCOPE(33、34)和CosMx(35)正在出现,这些方法可以在单个组织切片中检测数百到数千种不同的转录物;事实上,CosMx是第一种声称具有全转录组覆盖能力的成像技术,其面板可以检测高达18,000个基因。这些方法越来越多地用于验证新细胞类型和相互作用,包括在组织中从头识别。更高的通量通过循环的染色和成像步骤实现,但也带来了挑战:信号可能变得拥挤,且可能无法在面板中包含已知的、高度表达的标记基因。

除了通量,另一个重要的考虑因素是可成像区域(见表2)。技术如分子图谱提供了相对较小的可成像区域(43毫米2,从8×1厘米2区域中选择),但具有独特的三维(3D)视角以及由于广泛的z堆叠而更高的灵敏度和准确性。相比之下,Xenium的大型可成像区域(12×24毫米)降低了收集z堆叠的能力,但允许放置多个组织切片或组织微阵列,这些微阵列可以包含数百个组织核心。平台比较正在出现,以指导用户选择合适的检测方法(35、36)。大多数技术都兼容于成像后H&E或免疫荧光蛋白染色,并且所有方法都有其自己的方法来处理自发荧光,这是一种常见的成像问题。正如之前提到的,在基于测序的方法中,一个重要发展领域是使用膜染色进行细胞分割。事实上,基于成像的方法的一个优势是能够仅通过RNA点的分布识别组织(例如,肺中的上皮、血管和腺体),但添加蛋白质标记有助于进一步定义组织结构的细节。CosMx在这方面特别先进,提供1000通量的RNA与100通量的蛋白质染色相结合。

基于测序和基于成像的方法并非互相排斥。只要有足够资源,可以首先使用无偏的全转录组测序方法生成假设,然后使用基于成像的方法进行验证。高通量方法虽然每张切片成本更高,但能同时检测大量转录物,因此需要较少的组织切片;这对于珍贵的临床活检尤其重要。

在空间技术方面,结论是,能够提供全转录组空间基因表达数据的工具通常缺乏真正的单细胞分辨率,如Visium方法所示。然而,这些方法的分辨率正在不断提高(如STOmics、Visium HD和Curio),但这也可能导致数据稀疏性和测序成本增加。随着空间技术的成熟,转录组数据将越来越多地与蛋白质检测相结合;所讨论的技术在实验流程中整合这些额外染色步骤的能力有所不同。此外,未来的这些技术将整合其他组学数据模式,如ATAC-seq(检测染色质可及性)、突变检测或TCR和BCR测序,以提供更全面的细胞状态和行为的图景。生成带有空间标记的单核测序数据的可能性也在逐渐成为现实,例如Slide-tags(37)和XYZeq(38)。

计算方法和生物信息学分析是空间转录组学技术的另一重要组成部分。上述强大的空间转录组学技术有望在肺生物学中系统地回答新问题,但同时也带来了新的计算挑战。空间转录组学数据的典型分析始于预处理,以生成基因表达和位置矩阵,随后是下游分析,涵盖一系列任务,以理解细胞及其相互作用(见图2)。虽然线性流程类似于传统的探索性数据分析,其中每个任务独立建模和解决,但深度学习促进了开发能够同时建模和解决多个任务的复杂算法。

基于深度学习的算法代表了神经网络(NNs)在数据分析中的最新发展,成为用于数据处理的第三波重要应用。最初,1960年代引入了受物理和神经科学启发的神经网络,随后在1980年代发展了反向传播神经网络。深度学习时代始于2010年代,新的技术使多层神经网络能够学习相关特征,而无需手动提供这些特征。

最近,基础模型(如双向编码器表示从变压器(BERT)模型、生成预训练(GPT)模型等)也被开发出来(见图2)。基础模型是任何可以在大规模数据上进行预训练的模型,能够适应广泛下游任务(43,第3页)。在预训练过程中学到的信息丰富的特征,然后进行微调,可以导致出现(即,意外强大)的能力,例如从一个例子(如一种新细胞类型的一个细胞)或没有例子(例如,根据其ATAC特征推断一种新细胞类型的RNA特征)中学习。这种能力表明算法已经达到了一定的模式抽象水平,从而获得新的见解。

以下,我们将简要解释标准空间转录组学分析流程中的步骤,并突出我们实验室及其他研究者在研究呼吸系统及其他组织时常用的算法。对于更深入的讨论,读者可以参阅参考文献(44–46)或10x Genomics网站(46)。

预处理指的是将实验平台产生的信息组织成包含每个斑点和基因的空间坐标及转录组信息的数据库(通常以斑点-基因和斑点-坐标矩阵的形式)。预处理的类型严重依赖于所使用的实验平台是基于测序还是成像。

例如,在Visium平台上,这是一个基于测序的平台,并且通过组织学图像辅助,有三个预处理任务,可以通过10x Genomics的Space Ranger(46)或第三方算法完成:(a)将组织学图像对齐到组织切片,(b)在组织学图像中检测组织,以及(c)保留仅与组织重叠的斑点的转录物,校正其条码并使用参考基因组进行读数映射(STAR)。

在基于成像的Xenium平台上,主要的预处理步骤(由Space Ranger执行)包括(a)使用DAPI(4′,6-二脒基-2-苯基吲哚)DNA染色图像处理以校正镜头失真;(b)图像处理以过滤不太可能为真实转录物的点;(c)使用神经网络进行细胞分割,根据DAPI识别细胞核边界,然后将其扩展15微米(这一步骤也可以通过第三方算法Baysor(47)完成,它同时建模组织学图像和转录物的分布);以及(d)去重来自不同视野的读数,以推导最终的细胞特征矩阵。

下游分析指的是使用计数和坐标矩阵作为输入进行的任何分析,可以分为图2中所示的计算任务(CTs)。

CT1:质量控制和数据探索。在构建计数和位置矩阵之后,它们会经历质量控制过滤,其中一些斑点会被移除以进行进一步的分析。低质量斑点可能由于细胞损伤或死亡、低mRNA捕获效率等问题而干扰下游分析。它们可以根据诸如每个斑点的转录物计数、每个斑点的基因数量、线粒体基因计数的比例或每个斑点的细胞数量等属性进行过滤。这些变量的阈值应选择得当,使得被拒绝的斑点不与解剖区域相关(例如,肺泡在肺部的某些解剖区域自然具有较低的转录物计数)。

质量控制可以通过几种管道框架进行,这些框架提供交互式的数据探索,如Seurat(51)、SCANPY(52)、Squidpy(53)、scran(54)或Giotto(55)。这些框架还通过简单的方法和用户友好的环境处理下游分析的进一步步骤。

CT2:基因组和成像数据的样本整合。尽管预处理是逐个样本进行的,但对多个样本进行联合下游分析可以提高统计功效,并揭示可能干扰生物学结果的实验特定批次效应。许多用于整合scRNA样本的方法也可以应用于空间转录组学。例如,流行的R语言包Harmony(56)或互近邻(MNN)(57)用于进行批次校正。在Python中,常用的包包括BBKNN(58),它也依赖于在批次之间寻找MNN;几种生成模型,如scVI(59),通过在变分自编码器(VAE)的解码器上引入批次标签来学习批次特定效应;以及scArches(60),它使用迁移学习将新样本映射到现有样本上。由于批次效应可能干扰任何下游步骤,许多后续计算步骤的生成模型都有自己的方法来学习批次效应,例如多功能的NicheCompass(61)或STACI(62),后者使用带有噪声的过度参数化图变分自编码器(GVAEs)。为了评估整合的质量,易于使用的scIB(63)包提供了多种生物学保存和批次效应去除的指标。

整合多个数据集的另一个方面是将来自相邻组织位置的样本拼接在一起。例如,VisiumStitcher包(64)通过欧几里得变换拼接组织学图像,然后将其基因组信息转移到这些图像上。这对于肺部尤为重要,因为生物相关组织单位可能太大,无法在单个样本中捕获。

CT3:细胞类型注释。用于识别空间中每个点的细胞(s)类型的通常方法因平台(即,基于测序或成像)而异。在具有单细胞分辨率的空间转录组学中,细胞类型注释涉及使用注释的scRNA数据集识别每个细胞的类型,并推断未被检测的基因的表达。例如,ISS-Patcher通过将细胞投影到被检测的基因子空间后,利用其scRNA最近邻来重建细胞的转录组(65;65)。

对于多细胞分辨率的基于斑点的空间转录组学(例如Visium),细胞类型注释涉及细胞类型解卷积,其中我们推断每个斑点中的细胞类型丰度。实现这一目标的两种流行方法是Cell2location(66),这是一个贝叶斯模型,使用细胞类型作为因素,通过非负矩阵分解(NMF)对斑点-基因矩阵进行处理;以及DestVI(67),这是一个变分自编码器,通过将细胞类型基因表达特征作为先验,推断每个斑点中细胞的转录组,从而允许细胞类型变异或连续性。

CT4:解剖注释和解剖坐标。使用图像分析工具(如TissueTag(49))对组织学图像中的解剖区域进行注释可以指导进一步的基因组分析,并定义一个适用于样本整合的组织坐标系。定义组织轴取决于所研究的组织。例如,TissueTag中的OrganAxis包计算一个点距离最近的髓质和皮质的距离,而在肺部,可能会考虑从发育中的分支气道系统中从近端到远端的轴或在成人中的其他相关参数。在寻找肺部的坐标系时,一些研究还探索了分形几何(68)的使用,有时甚至早于数学家定义分形(69)。

CT5:空间可变基因。空间可变基因在不同位置之间变化,并且预期能够捕捉生物信息。它们可以通过传统的差异基因表达方法在不同解剖区域之间进行识别,如上文所述,或者使用专门针对空间转录组学开发的方法,如NicheCompass(61)。

CT6:空间区域和社区/生态位检测。空间转录组学可以强有力地识别功能组织生态位。一种简单的方法是通过潜在空间(即降维后的空间)进行聚类,如主成分分析空间和scVI潜在空间。对于Visium,聚类也可以在细胞类型丰度空间(由细胞解卷积推断)中进行。图神经网络(GNN)方法学习图的潜在空间,聚类在这些空间中考虑基因组相似性和空间坐标来推断空间生态位(61)。这个过程在邻近细胞具有相似转录特征时效果良好,但在空间异质性的情况下(如在肺纤维化患者的肺部中观察到的),空间方法的效果可能不如scRNA方法(71)。

CT7:细胞-细胞通信。细胞间通信的核心是细胞如何相互影响以及组织结构如何建立。细胞之间的相对位置及其转录组对于这一过程至关重要,通过调节配体表达和受体/信号转导分子。空间转录组学使我们能够量化这两种信息源,并结合精心整理的配体-受体相互作用列表,有助于解码细胞通信。CellPhoneDB(72)既是存储配体、受体及其相互作用的仓库,也是用于从转录组数据中预测丰富细胞相互作用的统计框架,考虑了配体和受体的亚基结构。CellPhoneDB或类似的工具如CellChat(73)可以应用于空间,即在先前步骤中识别的生态位内,或应用于整个组织样本。最优传输方法也因细胞通信而受到欢迎,例如,COMMOT(74);当给定一个潜在的配体-受体相互作用列表时,它可以推断特定的细胞-细胞配体-受体相互作用。关于细胞-细胞通信计算工具的详细综述和分类,可参阅参考文献(75)。

CT8:基因-基因相互作用。与细胞-细胞通信问题相反,是推断(新)基因-基因相互作用(如配体-受体相互作用)。这种推断基于在不同细胞中表达的基因,这些基因因位置相近而预期进行通信。例如,Hotspot(77)将Moran's I测试(见CT5)推广,以寻找空间共变的基因对。

CT9:空间轨迹。组织中的空间轨迹可以提供关于细胞迁移、侵袭和转移以及沿着组织轴的发育过程的机制性见解(78)。例如,stLearn(78)和stOrder(79)通过构建空间生态位之间的最小生成树来推断空间轨迹,同时考虑其转录差异和物理距离。同样,SpaceFlow(80)使用GNN学习空间和转录学感知的细胞潜在特征,然后在该潜在空间中使用扩散伪时间来构建空间轨迹。

空间基因组学的计算分析正在迅速发展。一个关键的发展是空间转录组学数据集的出现,这些数据集可以相互关联,例如,连续切片叠加以重建3D组织,或在时间上(46),例如,研究发育阶段中相似结构的变化。这些数据集很可能会推动时间图网络(81)的发展,以处理空间基因组数据的动态特性,如细胞迁移、疾病在时间和空间中的进展以及治疗干预(这些都与肺部有关)。

另一个重要趋势是向图基础模型的转变(39、82)。通过从大规模的空间数据集中学习信息丰富的特征表示,图基础模型可以促进更准确的预测,并在各种任务中表现出出现的能力。

通过GNN整合多种数据模态是值得探索的领域。例如,将空间转录组学与语言(如生理学家对解剖区域的定义或生物学家对基因的基因本体学术语)结合,可以将文本信息与基因组数据合成,提高结果的可解释性和上下文相关性。关于GNN在生物学和医学中的应用,见参考文献(83)。

一个剩余的挑战是如何处理在空间上相似但位置不同的数据点(例如,在不相互作用的两种组织类型之间)或多细胞相互作用。拓扑概念如sheaf神经网络(84)或simplex神经网络(85)可能是解决这些问题的有趣候选。

空间转录组学方法已经揭示了肺部疾病的新颖和意外的信号通路,同时成像方法能够全面解析细胞类型及其生态位,这有助于理解疾病进展和治疗靶点的发现。然而,由空间转录组学生成的关于疾病病因的假设仍需通过体外系统或小鼠模型进行验证,以区分与疾病相关的改变和因果改变。目前,空间转录组学的分析方法主要用于研究,但随着更高分辨率的商业技术的出现,我们期望这些方法未来能够成为诊断工具。

此外,肺部的其他疾病也开始使用空间转录组学进行分析,如Human Cell Atlas、LungMAP和HubMAP等联盟正在积极进行,但这一领域目前仍处于早期阶段。研究正在对慢性阻塞性肺病(COPD)(137、138)、哮喘(139)、结核病(140、141)和肺动脉高压(142、143)等疾病进行空间转录组学分析,这些研究正在定义与疾病阶段相关的生态位和基因调控异常,突出了特定于上下文的细胞-细胞通信回路,这可能成为未来治疗的基础。

空间转录组学方法讨论的这些方法通常分析二维组织切片中的基因表达模式。然而,细胞在三维环境中发挥作用,而CT4–9中的过程也发生在三维空间中。假设细胞的空间排列是一个简单的立方体,一个细胞的最近邻居中有三分之一在三维空间中,而其余的第二近邻居中有三分之二。这意味着大多数细胞的生态位无法在二维分析中被捕捉。这可以通过从连续切片生成分层空间转录组学数据来克服,然后使用计算方法重建三维结构(124、144)。最终,一个核心目标是将这些分子图与高分辨率的三维体积成像技术(如分层相位对比断层扫描(HiP-CT)(145))联系起来。

疾病表型的空间基因表达分析已经提供了关于疾病进展的见解,例如,在肺纤维化(IPF)中,不同的微环境与疾病严重程度相关。重要的是,每个微环境都由多种细胞类型的细胞-细胞相互作用所定义,并可能维持导致组织架构重塑的异常细胞群体。未来的治疗方法必须考虑到这种复杂性,并打破多种细胞类型之间的自我维持反馈回路,以恢复组织的健康稳态。迄今为止,空间转录组学分析主要集中在少数疾病上,但随着高分辨率商业技术的出现,我们预计这一范围将迅速扩展。另一个挑战是增加患者队列的遗传多样性,目前这一多样性仍然有限。我们知道,性别、年龄、环境暴露、感染等因素会影响细胞反应的多样性,但这些信息尚未整合到空间流程中(见图3)。

将所有这些变量纳入对肺功能的理解可能看起来是一项艰巨的任务,但它们都汇聚到有限的基因表达程序中。机器学习和人工智能工具越来越能够解读这些程序(152),并预测尚未测试的扰动对细胞反应的影响(153)。深度学习模型,如时间图神经网络、图和多模态基础模型以及基于拓扑的模型,将在解释空间数据和预测细胞反应方面发挥重要作用。数据的解耦和因果表示将进一步帮助我们理解因果关系。尽管深度学习和基础模型是生物信息学专家的兴奋工具,但用户友好的集成分析流程和易于查询的门户将是最大化数据影响和将发现转化为新疗法的关键。

总之,我们正处于一个令人激动的时期,空间解析转录组学与计算创新的快速发展将揭示肺部和气道令人惊叹的复杂性,为改善肺部健康铺平道路。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号