学术动态 | 空间转录组学数据分析方法及其在皮肤病研究中的应用案例(上)
基因表达谱分析法的快速发展使我们对于那些与发育、体内平衡和疾病相关的组织改变有了更深入的理解。高通量测序(NGS)一经问世便引发了一场组学革命,带来了激动人心的技术突破,如单细胞RNA测序(scRNA-seq),使此类组织的细胞异质性研究有了新的发现。scRNA-seq能够识别通常在批量分析中被掩盖的罕见细胞群,并精确定位特定细胞类型相关基因的表达。然而,scRNA-seq有很大的局限性,因为无法获得关键的空间信息,细胞很难从归档样本中分离,分离可能会在基因表达中引入伪影。此外,细胞通常作为由多种不同细胞类型组成的生态位的一部分来协调它们的行为,而单细胞分析缺乏空间信息限制了它们在这方面的生物学解释。为了解决这一关键限制,最新的组学技术包括一系列旨在量化完整组织中基因表达的方法,统称为空间转录组学(ST),它保留了组织中表达的转录物的原位空间位置。ST有可能阐明受彼此接近影响的细胞类型之间基因表达变化的协调性,从而为细胞间通讯提供信息。
本期推送为大家带来的这一篇研究论文总结了空间转录组学的数据分析方法并概述其在皮肤病研究中的应用。

空间转录组学技术概述
-
空间转录组学(ST)包括多种方法,旨在直接从完整组织量化RNA表达。
-
ST方法包括原位杂交(ISH)、原位测序(ISS)和原位捕获(ISC)技术,每种技术都有自己的优势和局限性。
-
ST方法可以与单细胞RNA测序(scRNA-seq)相结合,以最大限度地提高数据的分辨率和深度。
-
ST数据分析可以定位感兴趣的细胞类型,识别组织模式,即组织内细胞类型的小生境,并揭示潜在的细胞-细胞相互作用(CCI)。
优点
- ST提供了在原生环境下同时在完整组织内对数百到数千个基因进行高通量分析的功能,保留了转录本的空间定位。
- 能够评估组织生态位和CCI内细胞类型的空间组织。
- 各种计算分析工具的可用性,也可以促进与scRNA-seq数据的集成。
缺点
- 每种ST方法在分辨率、捕获效率或转录组覆盖率方面都有自己的局限性,选择的负担落在研究者身上。
- 大多数ST方法针对新鲜冷冻组织进行了优化,而对福尔马林固定石蜡包埋组织的适应方案则滞后。
- 每个感兴趣的组织可能需要额外优化分析参数。
- 到目前为止,高昂的成本、劳动力和对专用设备的需求限制了广泛采用。
- 分析方法的广泛可能会导致很难找到最适合研究人员需求的方法。

图1 空间转录组学技术概述
(a) ISH方法通过荧光标记探针检测特定的靶基因。来自靶向短转录物序列的探针的信号通过连续的杂交、成像和探针剥离进行传播。所描述的步骤具体遵循seqFISH方法。
(b) ISS方法通常涉及与靶基因的RNA或cDNA互补的条形码挂锁探针的杂交和连接。然后通过连接进行多轮靶基因扩增和测序,从而实现不同靶基因的空间分辨率。所描述的步骤具体遵循ISS的条形码挂锁探针方法。
(c) ISC方法使用包含一系列具有不同位置条形码和多聚T序列的RT引物的捕获点来捕获mRNA转录本。RT产生的cDNA是通过下一代测序技术提取和测序的。位置条形码被映射到组织上的特定位置,并实现转录组的空间可视化。所描述的步骤具体遵循10X Visium方法。
空间转录组学的数据分析方法
预处理后,ST数据的下游分析寻求识别具有一致基因表达的空间域,例如组织小生境和细胞-细胞相互作用(CCI),或病变组织中可能发生异常相互作用的致病区域。这可以通过聚类等方法以及涉及整合scRNA序列数据的方法来实现,如映射、反卷积和配体-受体分析,这些分析为细胞间通信提供信息(图2b-d)。
聚类将基因表达谱与组进行比较,并确定相似的细胞类型(如果数据是单细胞分辨率,如HPRI)或细胞类型组织模式,如组织层或微环境,不能单独使用scRNA-seq重建。虽然非空间聚类方法可以应用于ST数据,但直接结合空间信息的聚类方法正在迅速发展。这些方法包括考虑邻近spot信息、组织的组织学和细胞形态学以改善从数据中恢复组织结构的能力。
映射和反卷积分别将scRNA序列数据与HPRI数据或ISC数据中的空间数据进行整合。映射试图将scRNA-seq解析的细胞类型分配给HPRI数据中的空间对应物。反卷积旨在预测ISC数据中从每个spot回收的转录本混合物中存在的scRNA-seq细胞类型的比例,这可以将多细胞分辨率ISC数据转换为单细胞分辨率。映射和反卷积的一个共同目标是生成可用于空间信息配体-受体分析的细胞类型图。这些分析寻找近端位置(如相邻细胞类型)配体和受体的统计显著共表达,并通过考虑距离对基因表达的影响来预测细胞通讯事件的可能性。考虑到大多数旁分泌和旁分泌信号事件的空间限制,空间信息配体-受体分析可以通过消除仅从空间上不可信的scRNA-seq分析得出的CCI来最大限度地预测CCI。
不同的方法适合不同的研究目的。因此,可能需要同时应用几种方法来实现一个人的全部分析目标。

图2 数据分析工作流
(a) 对于ISC,原始测序数据被处理成由基因和捕获点组成的计数矩阵(该步骤因ST技术而异,因为ISH/ISS涉及将荧光成像信号转换成类似的计数矩阵)。矩阵的预处理涉及获得质量控制指标,例如每个点的UMI分布(每个点的计数)和每个点的基因,以及数据标准化。降维方法包括摘要方法(PCA)和可视化方法(UMAP和t-SNE),这两种方法都试图将基因表达数据降维为更小的维度,以便进行更具信息性的分析。
(b) 聚类分组类似的spot转录组,可在原始组织图像上转置以进行一般解释。
(c) 作图和反卷积结合scRNA序列数据和空间转录组学数据来定位细胞亚群。作图通常使用ISH数据定位scRNA序列图谱,并预测组织内的特定细胞类型。反卷积通常使用ISC数据来推断每个spot的细胞类型比例。
(d) 映射和反卷积生成的细胞类型图可用于配体-受体分析。细胞类型的接近有助于推断细胞-细胞通讯事件。
未完待续……
参考文献:
[1] Piñeiro AJ, Houser AE, Ji AL.Research Techniques Made Simple: Spatial Transcriptomics. J Invest Dermatol.2022;142(4):993-1001.e1. doi:10.1016/j.jid.2021.12.014
新闻中心
News Senter
上海生物芯片有限公司
Shanghai Biochip Co., Ltd.
版权所有©上海生物芯片有限公司
电子邮箱:
marketing@shbiochip.com
地址: 上海市浦东新区张江高科技园区李冰路151号
技术电话:
4001002131
扫描查看
微信公众号