• 中文
  • English
끠
  • 网站首页
  • 关于SBC
    • 公司简介
    • 公司战略
    • 股东资源
    • 专家委员会
    • 交流合作
    • 资质荣誉
    • 组织架构
    • 成员企业
  • 新闻中心
  • 资源中心
    • 技术文章
    • 视频精选
    • 资料下载
    • 生信资源
    • 策源平台
  • 联系我们
    • 在线咨询
    • 联系方式
    • 招贤纳士
  • 产品服务
  • 技术平台
  • 类器官库
    类器官芯片
    类器官科研应用方案-3DSc
    iPSC来源类器官服务
    “亚洲一号”类器官与器官芯片服务
    器官芯片服务
    组织来源类器官服务
    验证服务
    Real-time PCR验证
    基因编辑
    Digital PCR验证
    多色免疫荧光
    生信分析服务
    细胞实验
    动物实验
    蛋白组服务
    蛋白质组服务
    免疫检测分析
    组织芯片
    组织芯片服务
    定制组织芯片
    转录组服务
    表观组服务
    基因组服务
    基因组、表观遗传组服务
    “芯空一号”单细胞多组学服务
    PCF单细胞原位空间蛋白组
    “芯空一号”空间多组学服务
    GeoMx DSP空间转录组/蛋白组
    LCM+质谱-深度空间蛋白组
    试剂盒产品
    核酸提取试剂盒
    类器官培养基及相关试剂盒
    低丰度蛋白检测试剂盒
    CosMx SMI单细胞空间原位转录组/蛋白组
    Visium CytAssist(HD)空间转录组
    • 生物样本库
    • 基因芯片
    • 新一代测序
    • 基因编辑
    • 蛋白检测
    • 组织芯片
    • 分子病理
    • 分子检测
    • 分子诊断
    • 生物信息
网站首页  ꄲ  技术文章  ꄲ  探秘全基因组关联分析第三期:关联分析

新闻中心   News Senter

探秘全基因组关联分析第三期:关联分析

 

经过前面两期的讲解,我们了解了GWAS分析需要的数据类型和数据质控方法,终于来到我们的核心内容:关联分析。

 

GWAS分析一般会构建回归模型检验标记与表型之间是否存在关联,其中:

① 零假设(H0 null hypothesis)是标记的回归系数为零, 标记(即SNP)对表型没有影响。

② 备择假设(H1,Alternative Hypothesis)是标记的回归系数不为零,标记(即SNP)和表型相关。

 

在第一期中我们提到表型数据的类型包括三种:数量性状、质量性状和分级性状,我们在进行关联分析之前,需要根据不同类型的表型选择合适的关联分析方法,同时为了减少假阳性,通常对p值进行矫正。

 

 

1、连续性状 

 

连续性状是指那些在群体中呈现连续分布的性状,如身高、体重、血压等。可以选择的方法有T检验(Student’s test)和线性回归(linear regression)。

 

--assoc,卡方检验+优势比,表型若为数字则视为字符,不允许有协变量;

--linear,线性回归,表型为纯数字,允许有协变量,如果考虑协变量,加上--covar即可。

# assoc关联分析不校正/校正p值

plink --bfile test --assoc --out result_assoc

plink --bfile test --assoc --adjust --out result_assoc

注意:会多出一个*.assoc.adjusted后缀文件。

# linear关联分析不考虑协变量、不校正/校正p值

plink --bfile test --linear --out result_linear

plink --bfile test --linear --adjust --out result_linear

 

注:协变量使用 --covar 参数添加。

 

 

2、阈值性状 

 

阈值性状即表型值数据是两类数据:1和2(其中0和-9都表示缺失),比较常见的是对照组(用1表示)和实验组(用2表示)。可以选择的方法有卡方检验和逻辑斯蒂回归(X2关联分析和logistic分析)

 

--assoc,卡方检验+优势比,不允许有协变量;

--logistic,逻辑回归,允许有协变量,如果考虑协变量,加上--covar即可。

注:这里的协变量比如性别、年龄等信息。

# assoc关联分析不校正/校正p值

plink --bfile test --assoc --out result_assoc

plink --bfile test --assoc --adjust --out result_assoc

注意:会多出一个*.assoc.adjusted后缀文件。

# logistic关联分析不考虑协变量、不校正/校正p值

plink --bfile test --logistic --out result_logistic

plink --bfile test --logistic --adjust --out result_logistic

 

注:协变量使用 --covar 参数添加。

 

 

3、分级性状 

 

我们将通过人为观察而可以进行分类的离散型变量统称为分级性状。但要注意一点,分级性状最终的定义,还是部分依赖于我们的经验。 例如,对于植物的抗病性,我们既可以按照叶片病斑的面积(0~100%),将其定义为连续型的数值型性状,也可以人为设定阈值将其定义为分级性状(高、中、低)。可以选择的方法有卡方检验和逻辑斯蒂回归(X2关联分析和logistic分析)。

 

--assoc,卡方检验+优势比,不允许有协变量;

--logistic,逻辑回归,允许有协变量,如果考虑协变量,加上--covar即可。

# assoc关联分析不校正/校正p值

plink --bfile test --assoc --out result

plink --bfile test --assoc --adjust --out result_adjust

# logistic关联分析不考虑协变量、不校正/校正p值

plink --bfile test --logistic --out result_logistic

plink --bfile test --logistic --adjust --out result_logistic

 

注:协变量使用 --covar 参数添加。

 

 

到这一步我们终于得到了梦寐以求的显著性结果,可以对结果表格进行pvalue筛选过滤假阳性,也可以进行可视化直观展示(即鼎鼎大名的Q-Q plot和Manhattan图),那如何进行可视化呢?别急,我们留到下一期。

 

ꄴ上一篇: 无
ꄲ下一篇: 无

新闻中心

News Senter

  • 新闻中心

上海生物芯片有限公司

Shanghai Biochip Co., Ltd. 

版权所有©上海生物芯片有限公司

电子邮箱:

marketing@shbiochip.com

地址: 上海市浦东新区张江高科技园区李冰路151号

技术电话:

4001002131

   沪ICP备05045514号-1

微信公众号 上海生物芯片

扫描查看

微信公众号

沪公网安备31011502004591号

 本网站由阿里云提供云计算及安全服务
本网站支持 IPv6
 本网站由阿里云提供云计算及安全服务
本网站支持 IPv6
 本网站由阿里云提供云计算及安全服务
本网站支持 IPv6
 本网站由阿里云提供云计算及安全服务
本网站支持 IPv6