生物数据工具箱:从入门到精通的数据库攻略(八)- CancerSEA数据库介绍
CancerSEA(Cancer Single-cell State Atlas)是一个专注于在单细胞水平上解析癌细胞功能状态的专用数据库。该数据库由哈尔滨医科大学的研发团队构建,其核心目标是帮助研究人员探索肿瘤细胞的功能异质性,并理解基因与关键癌症生物学过程之间的关联。

图1 CancerSEA 数据库概述
打开CancerSEA官网(http://biocc.hrbmu.edu.cn/CancerSEA/),进入数据库主页(图2)。该数据库主要提供以下4种功能,接下来将为您逐一介绍。

图2 CancerSEA 数据库主页
1、搜索与特定基因/基因集相关的肿瘤细胞功能状态
在CancerSEA主页上方选择“Search”进入搜索页面(图3)。您可以在第一个搜索框中输入某个蛋白编码基因(PCG)或lncRNA的名称,以查询该基因与哪些功能状态相关。以SOX4基因为例,搜索结果(图4)主要包含以下四个部分:
1)基因基本信息:显示SOX4基因的详细描述与功能摘要。
2)跨癌种功能状态相关性:以气泡图和分数表的形式,展示SOX4在不同类型肿瘤细胞中与14种功能状态的相关性。
3)特定数据集中的表达与关键状态:在选定肿瘤的某一数据集中,呈现SOX4的表达水平,并列出与其最相关的3个功能状态。
4)细胞亚群中的表达与功能分析:在同一数据集中,通过箱线图和feature plot展示SOX4的表达分布,并进一步在不同肿瘤细胞亚群中分析其表达水平及最相关的3个功能状态。

图3 CancerSEA 数据库搜索功能界面

图4 SOX4相关的肿瘤细胞功能状态搜索结果
在搜索功能页面的第三个搜索框中,您可以输入多个感兴趣的基因或上传基因集列表进行查询。此外,CancerSEA还内置了来自GO、KEGG、Reactome和MSigDB等多个权威数据库的肿瘤相关通路与基因集,方便用户直接选用。基因集搜索结果的展示形式与单基因结果类似,此处不再赘述。
2、搜索与特定肿瘤细胞功能状态相关的基因
在CancerSEA主页上方选择“Search”进入搜索页面(图3)。您可以在第二个搜索框中,通过选择目标肿瘤类型和感兴趣的功能状态,查询与该功能状态显著相关的PCG和lncRNA。以选择“乳腺癌(Breast cancer)”和“转移(Metastasis)”为例,搜索结果(图5)主要包含以下三个部分:
1)功能状态活性概览:展示“转移”功能在乳腺癌不同数据集的肿瘤细胞中的活性。用户可选择特定数据集,查看该数据集中的详细分析结果。
2)关联基因列表:列出在乳腺癌肿瘤细胞中,与“转移”功能显著相关的PCG和lncRNA。
3)功能富集分析:基于与“转移”显著相关的PCG,进行GO功能和KEGG通路富集分析,从而识别出与“转移”显著相关的信号通路和功能基因集。

图5 乳腺癌中与“转移”相关的PCG和lncRNA搜索结果
3、搜索特定数据集的信息
在CancerSEA主页上方选择"Browse",进入浏览页面(图6)。用户可先选择目标癌症类型,再选定具体数据集,以查询该数据集的详细信息。以选择结直肠癌(Colorectal cancer)中的"Li H. Nat Genet. 2017 (Colon)"数据集为例,搜索结果(图6)主要包含以下五个部分:
1)数据集基本信息:包括癌症类型、肿瘤细胞数量、组织类型、细胞群数量、基因种类、详细描述、数据集来源及发表文献链接。
2)功能状态活性图谱:展示14种功能状态在该数据集肿瘤细胞中的活性分布。
3)细胞降维分布图:呈现肿瘤细胞在低维空间中的分布情况。
4)高可变基因表达热图:显示高可变基因在不同细胞群中的表达水平。
5)CNV推测图谱:基于单细胞转录组数据,推断不同肿瘤细胞群在各染色体上的拷贝数变异(CNV)扩增与缺失情况。

图6 结直肠癌中“Li H. Nat Genet. 2017 (Colon)”数据集的搜索结果
4、下载特定单细胞转录组数据集和功能状态基因集
在CancerSEA主页上方选择“Download”,即可进入下载页面(图7)。该页面主要提供两类资源的下载:
1)单细胞转录组数据集:页面第一个表格列出了CancerSEA收录的所有肿瘤单细胞转录组数据集信息。用户可通过搜索癌症名称筛选目标数据集。表格中的“Accession”号指明了数据集的原始来源,用户可据此到对应的公共数据库下载完整数据。“State Score”列则提供了由CancerSEA计算出的每个细胞在14种功能状态上的活性分数。
2)功能状态基因集:第二个表格提供了CancerSEA从GO、MsigDB及文献中收集整理的14种功能状态基因集,包含详细的功能描述,用户可直接下载使用。

图7 肿瘤单细胞转录组数据集和14种功能状态基因集下载页面
本期我们系统地探索了CancerSEA数据库的核心功能,从基因查询、功能状态关联分析到特定数据集的深入浏览与数据下载,为大家解读癌症单细胞功能状态提供了强大的利器。我们后续也将持续推出更多生物学数据库的介绍,如果您有特别想了解的数据库,欢迎在评论区留言告诉我们!
新闻中心
News Senter
上海生物芯片有限公司
Shanghai Biochip Co., Ltd.
版权所有©上海生物芯片有限公司
电子邮箱:
marketing@shbiochip.com
地址: 上海市浦东新区张江高科技园区李冰路151号
技术电话:
4001002131
扫描查看
微信公众号