使用CopyKAT鉴定恶性细胞
单细胞拷贝数变异(CNV)分析基于单细胞转录组数据,利用不同样本或不同细胞类型之间的基因表达量预测大规模染色体水平的CNVs,发现拷贝数异常的细胞,从而帮助推断肿瘤恶性细胞,为肿瘤异质性、克隆进化的研究奠定基础。
目前我们用的最多的就是inferCNV,但inferCNV 存在以下两点限制:
1、需要正常细胞矩阵作为对照;
2、需人为判定每个 barcode 的恶性与否。
为了更便捷的区分肿瘤细胞和正常细胞,德克萨斯大学安德森癌症中心的研究人员开发了一种基于贝叶斯方法的单细胞测序数据拷贝数分析算法--CopyKAT(copy number karyotyping of aneuploid tumors,非整倍体肿瘤的染色体核型分型)。该方法通过在单细胞中检测全基因组非整倍体来区分肿瘤细胞与正常细胞,并给出具体的拷贝片段起止位点,适用于高通量单细胞RNA测序数据。
网址:https://github.com/navinlabcode/copykat

copyKAT分析流程图
1、首先对原始表达counts矩阵进行标准化(a)
2、使用高斯混合模型(GMM)构建一个标准二倍体拷贝数基线(b)
3、利用马尔可夫链蒙特卡罗迭代(MCMC)算法推断CNV的断点(breakpoints)并得到segments(c)
4、根据基因表达量分布的不同可以将正常细胞和肿瘤细胞区分开来(d)
5、肿瘤细胞和正常细胞可视化展示,肿瘤细胞还可以继续聚类得到其亚群(e)
软件使用介绍
library(copykat)
copykat.test <- copykat(rawmat=exp.rawdata,
id.type="S",
ngene.chr=5,
win.size=25,
KS.cut=0.1,
sam.name="test",
distance="euclidean",
norm.cell.names="",
output.seg="FLASE",
plot.genes="TRUE",
genome="hg20",
n.cores=8)
有几点需要说明:
1、exp.rawdata使用原始表达counts矩阵,行名是基因,列名是细胞标签(UMI),不要使用标准化后的data,因为copyKAT里面会进行标准化
2、物种仅支持人和小鼠,通过genome参数设置hg20或mm10
3、可以设置对照组,通过norm.cell.names参数设置,格式是一组细胞标签向量
4、copyKAT软件运行较慢,可以通过n.cores参数设置多线程提高效率
5、此外作者提及儿童肿瘤和血液肿瘤不适合使用该方法
copyKAT把我们需要的结果都直接给出了,包括以下结果:
1、test_copykat_prediction.txt:copykat 预测分析结果,包含正常细胞(diploid)、肿瘤细胞(aneuploid)和未识别细胞(not.defined);
2、test_copykat_CNA_results.txt:每个CNV segment在每个细胞的表达量;
3、test_copykat_heatmap.jpeg:肿瘤细胞和正常细胞CNV表达热图,蓝色表示缺失,橙色表示扩增。
文献摘录
这里介绍一篇发表于2021年的文章《Delineating copy number and clonal substructure in human tumors from single-cell transcriptomes》,研究者使用copyKAT软件对乳腺导管原位癌(ducal carcinoma In situ DCIS-1)患者1480个细胞进行拷贝数变异分析,并且与inferCNV软件进行比较,结果显示,CopyKAT预测的结果与全基因组测序具有很高的一致性 (Pearson相关系数0.82),而inferCNV 预测的结果稍低于CopyKAT(Pearson相关系数0.79)。

然后作者将 CopyKAT 应用于三组之前发表的5例胰腺癌(PDAC)患者(图a)、5例间变性甲状腺癌(ATC)患者(图b)、5例三阴性乳腺癌(TNBC)患者(图c)的单细胞转录组数据,将预测的非整倍体肿瘤细胞和正常二倍体细胞结果(图d-f)与利用肿瘤上皮标志物打分的注释结果进行对比,结果表明,CopyKAT 可以准确 (98%±3% s.d.) 区分多种实体肿瘤中的肿瘤细胞和正常细胞,而不需要特定的基因表达标记。

新闻中心
News Senter
上海生物芯片有限公司
Shanghai Biochip Co., Ltd.
版权所有©上海生物芯片有限公司
电子邮箱:
marketing@shbiochip.com
地址: 上海市浦东新区张江高科技园区李冰路151号
技术电话:
4001002131
扫描查看
微信公众号