百篇文献汇总精华!富集分析来引路,文献图表不辜负
我们通过亚群分析或者差异分析,可获得大量特异高表达或者差异表达的基因,为了理解这些基因的生物学功能,一般会进行富集分析,再加以过滤和筛选,以便获得更有意义的功能信息。
因为一个生物过程通常不是由一个基因单独参与,而是由一组基因共同参与的。因此,我们可以对不同的基因进行分类,将具有类似功能的基因放在一起,找到差异基因富集到的通路,实现功能与表型的关联,进而与生物学意义联系起来。目前最常用的方法是GO term功能富集、KEGG pathway通路富集。GO富集分析可以观察基因富集到哪些功能上,包括生物学过程(BP),分子功能(MF),细胞组成(CC),KEGG富集可以观察基因聚集到哪些通路上。可视化展示的方式很多,如条形图、气泡图、热图等,其中条形图和气泡图最常见。
01 气泡图
气泡图可以对数据库富集的通路进行可视化,是富集常用的可视化图形之一。一般我们会挑选显著分析的前30左右的 pathway/term进行展示。相关图片在30%的单细胞文献中存在,百篇文章共出现72次。文献展示结果如下:

该文章中作者别出心裁地用通路作为横坐标,富集因子作为纵坐标,点的颜色代表着P值,点的大小代表着差异基因在通路中的数量。而我们最常见到的气泡图如下,与文章里的图片横纵坐标调换位置。

同时,气泡的排列顺序是按照我们的富集结果表格顺序排列,有时候这样的排列方式不能更好地展示出我们的意图,于是我们将气泡按照富集因子的大小排序,如下图所示。除此之外根据项目的需要,也可以按照P值大小或者基因数量排列的方式进行多种样式调整。

02 条形图
柱状图也是对数据库富集的通路进行可视化的一种方式,是富集常用的另外一种可视化图形。一般来说,它同样挑选显著的pathway/term进行展示。相关图片在16%的文献中出现,百篇文章共出现46次。 我们最常见到的展示形式如下,纵坐标为GO term,横坐标为富集因子,按柱状图柱子颜色区分 GO ONTOLOGY。

在此基础上,我们可进一步优化提供的GO 富集展示结果如下,我们用纵坐标标签的颜色来区分GO ONTOLOGY,柱状图柱子颜色用来展示富集分析的P值,将分析结果展示最大化。

除了常规分析中能见到的的条形图外,还可以将多个细胞群合并展示的柱状图,如下图所示。它可以更好地展示不同亚群之间对比重点突出的GO term / KEGG pathway。

横坐标为归一化后的Count值,纵坐标为GO term,用柱子颜色来展示富集因子大小。另外我们还可以选择展示P值结果,如下:

03 热图
在我们经过一系列的分析筛选后,我们从细胞群中得到了具有重要意义的通路。这些通路在不同的细胞类型下的基因表达差异明显,于是我们可以选择用热图来展示结果,如下所示。相关图片在超20%的文献中存在,百篇文章共出现59次。

我们进行美化调整后的结果如下:

横坐标为细胞群,纵坐标为通路名称,图中颜色代表着表示该通路在不同细胞群中的信号值高低,越红,信号值越高,越蓝,信号值越低。
04 雷达图
除了以上展示结果外,我们还在文献中看到了一张有意思的展示图,作者用雷达图来绘制不同细胞群的多个感兴趣的通路富集情况。

雷达图(radar chart),是一种表现多维数据的强弱的图表。它将多个维度的数据量映射到坐标轴上,这些坐标轴起始于同一个圆心点,通常结束于圆周边缘,将同一组的点使用线连接起来就称为了雷达图。
目前,我们可提供多样的雷达图展现形式,结果如下:

在上图中,每一个点的在极坐标上的位置代表着P值的大小,每一张图只有一个最大值,但是当存在极端值时,我们的展示图不能很好地说明结果。于是我们将每个细胞群的表达值归一化,每个细胞群都存在一个最大值,如下图所示:

以及用富集因子的大小展示结果如下:

以上是我们在富集分析结果展示方面可提供的多样展示形式,将其进行整合后,输出的结果如下图所示:

好了,有关单细胞数据中,富集分析的相关展示图分享到此,后续的更加丰富的内容且听下回分解。
新闻中心
News Senter
上海生物芯片有限公司
Shanghai Biochip Co., Ltd.
版权所有©上海生物芯片有限公司
电子邮箱:
marketing@shbiochip.com
地址: 上海市浦东新区张江高科技园区李冰路151号
技术电话:
4001002131
扫描查看
微信公众号