• 中文
  • English
끠
  • 网站首页
  • 关于SBC
    • 公司简介
    • 公司战略
    • 股东资源
    • 专家委员会
    • 交流合作
    • 资质荣誉
    • 组织架构
    • 成员企业
  • 新闻中心
  • 资源中心
    • 技术文章
    • 视频精选
    • 资料下载
    • 生信资源
    • 策源平台
  • 联系我们
    • 在线咨询
    • 联系方式
    • 招贤纳士
  • 产品服务
  • 技术平台
  • 类器官库
    类器官芯片
    类器官科研应用方案-3DSc
    iPSC来源类器官服务
    “亚洲一号”类器官与器官芯片服务
    器官芯片服务
    组织来源类器官服务
    验证服务
    Real-time PCR验证
    基因编辑
    Digital PCR验证
    多色免疫荧光
    生信分析服务
    细胞实验
    动物实验
    蛋白组服务
    蛋白质组服务
    免疫检测分析
    组织芯片
    组织芯片服务
    定制组织芯片
    转录组服务
    表观组服务
    基因组服务
    基因组、表观遗传组服务
    “芯空一号”单细胞多组学服务
    PCF单细胞原位空间蛋白组
    “芯空一号”空间多组学服务
    GeoMx DSP空间转录组/蛋白组
    LCM+质谱-深度空间蛋白组
    试剂盒产品
    核酸提取试剂盒
    类器官培养基及相关试剂盒
    低丰度蛋白检测试剂盒
    CosMx SMI单细胞空间原位转录组/蛋白组
    Visium CytAssist(HD)空间转录组
    • 生物样本库
    • 基因芯片
    • 新一代测序
    • 基因编辑
    • 蛋白检测
    • 组织芯片
    • 分子病理
    • 分子检测
    • 分子诊断
    • 生物信息
网站首页  ꄲ  技术文章  ꄲ  实用小工具详解:如何既简又快地检测外显子拷贝数变异?

新闻中心   News Senter

实用小工具详解:如何既简又快地检测外显子拷贝数变异?

 

人类染色体在遗传过程中,有时候会丢失或增加一部分,遗传学将这种DNA的增减现象称为拷贝数变异(CNV)。CNV通常为长度大于1kb的片段变异,里面往往包含一个或多个基因,若变异片段包含功能特别重要、对剂量水平敏感的基因,就会导致疾病的发生,可导致智力低下、发育异常等症状,引起残疾、甚至死亡。

 

外显子不同于基因组,由于是捕获测序,本身就是各个外显子区域分割开来,这样造成2个影响:(1)大片段的CNV被切开形成多个假阳性;(2)只能检测小的CNV。因此对检测软件要求很灵敏。

 

目前有很多检测CNV的工具,比如CNVseq、CNVnator/CNVpytor、Conifer、WisecondorX等,但这些工具要么是安装难度大,要么是不适合外显子CNV检测,又或者使用繁琐。有没有一种安装方便、用法简单、适合外显子CNV检测的工具?就是今天要说的CNVkit。

 

CNVkit于2016年发表在PLOS computational biology上,详见《CNVkit: Genome-Wide Copy Number Detection and Visualization from Targeted DNA Sequencing》。CNVkit是基于Python3.7+开发的一款专门用于基因组高通量测序数据拷贝数变异(CNV)检测工具,并提供多种可视化方法。

 

官网:https://cnvkit.readthedocs.io/en/stable/#

 

img1

CNVkit分析流程示意图

 

该方法将in-target和off-target区域划分成小的bin区间,统计每个bin区间内的测序深度、GC含量,并通过GC含量、目的区域的大小和分布密度等对原始测序深度进行校正,去除肿瘤样本中的背景噪音,然后计算肿瘤样本相对正常样本对应位置拷贝数的log2 ratio值, 最后采用segment算法进行过滤,得到最终的肿瘤样本拷贝数变异结果。

 

 

软件安装使用介绍

 

1、通常我们使用conda安装,另外需要额外安装R包DNAcopy,因为CNVkit内部需要借助DNAcopy包进行拷贝数估算,安装没什么幺蛾子,比较顺利。

 

2、需要下载基因注释文件,用于对CNV结果进行基因注释,这倒省了我们单独注释的麻烦。该文件可以在UCSC上下载:https://hgdownload.cse.ucsc.edu/goldenPath/hg19/database/refFlat.txt.gz

PS:如果需要做hg38或其他物种,可以从NCBI下载物种基因组注释文件(gtf或gff格式),提取信息自行制作refFlat.txt.gz文件,格式跟UCSC下载的保持一致即可。

 

3、参考基因可在NCBI或UCSC上下载,需要与refFlat.txt.gz文件基因信息一致。

 

4、样本bam数据,参考BWA流程获得。

 

5、一键运行:

$cnvkit access $ref -s $window -o $out/access-${window}.bed

$cnvkit.py batch --method hybrid $Tumor.bam \

--normal $Normal.bam\

--annotate $refFlat \

--fasta $ref \

-t $target.bed \

--access $out/access-${window}.bed \

-d $output \

--segment-method hmm \

--diagram \

--scatter \

-p 6

PS:使用CNVkit的batch命令,可以一步完成所有分析步骤,最后用--diagram和--scatter用于绘制拷贝数变异总览图和染色体分布图,不需要可以不使用。

 

 

文献摘录

 

这里介绍一篇发表于2022年的文章《Gliosarcoma: The Distinct Genomic Alterations Identified by Comprehensive Analysis of Copy Number Variations》,研究者使用CNVkit对胶质母细胞瘤(GBM)和胶质肉瘤(GSM)的DNA拷贝数变异(CNV)进行了全面分析,下图就展示了21例GBM 和15例GSM 样本拷贝数变异在染色体上的分布(该图使用CNVkit自带参数heatmap生成)。

 

img2

Figure 1 横坐标是染色体,纵坐标是样本,红色表示拷贝数扩增,蓝色表示拷贝数缺失,颜色越深,表示拷贝数扩增/缺失越多

 

ꄴ上一篇: 无
ꄲ下一篇: 无

新闻中心

News Senter

  • 新闻中心

上海生物芯片有限公司

Shanghai Biochip Co., Ltd. 

版权所有©上海生物芯片有限公司

电子邮箱:

marketing@shbiochip.com

地址: 上海市浦东新区张江高科技园区李冰路151号

技术电话:

4001002131

   沪ICP备05045514号-1

微信公众号 上海生物芯片

扫描查看

微信公众号

沪公网安备31011502004591号

 本网站由阿里云提供云计算及安全服务
本网站支持 IPv6
 本网站由阿里云提供云计算及安全服务
本网站支持 IPv6
 本网站由阿里云提供云计算及安全服务
本网站支持 IPv6
 本网站由阿里云提供云计算及安全服务
本网站支持 IPv6