探秘全基因组关联分析第四期:结果可视化
GWAS的结果可以通过QQ图和曼哈顿图进行可视化。QQ图则用于评估关联分析的整体质量,曼哈顿图展示了全基因组范围内SNP的关联显著性。
1、Q-Q图
QQ图(quantile-quantile plot):也叫做分位图,是判断GWAS分析结果假阳性、假阴性的重要指标。它用于评估观察到的P值分布与期望的P值(根据均匀分布计算得到的结果)分布之间的差异。理想状态下y=x,这些点应该落在y=x这样一条过0点、斜率45度的直线上。
# install.packages("qqman")
library(qqman)
# 读取assoc/logistic 关联结果
results_as <- read.table(“demo.final.assoc”, head = TRUE)
png("QQ-Plot.png", width = 6, height = 6, units = "in", res = 300)
qq(results_as$P, main="Q-Q plot of GWAS")
dev.off()

Q-Q图说明:
图中纵坐标是SNP位点的pvalue值,即观测到的pvalue;横坐标则是均匀分布的概率值,即期望的pvalue,同样也是换算为-log10。因为大部分SNP是独立的,所以它们的期望P值和实际P值相近,分布在一条直线上,少部分SNP存在连锁不平衡,导致它们的实际P值会大于期望P值(连锁会导致两个基因一同遗传的概率远大于独立遗传),分布上就会位于直线上方。
2、Manhattan图
Manhattan图:因其形似曼哈顿摩天大楼,故俗称为曼哈顿图。本质上它是一个散点图。基因位点的P value越小即-log10(P value)越大,表示该位点与表型性状或疾病等关联程度越强。
library(qqman)
results_as <- read.table("demo.final.assoc", head=TRUE)
png("Manhattan.png", width = 12, height = 6, units = "in", res = 300)
manhattan(results_as, chr="CHR", bp="BP", p="P", snp="SNP", main="Manhattan plot")
dev.off()

曼哈顿图说明:
图中每个点代表一个SNP,纵坐标为每个SNP计算出来的pvalue换算为-log10(Pvalue),横坐标为SNP所在的染色体。基因位点的P值越小,即-log10(Pvalue)越大,其与表型性状或疾病等关联程度越强。红/蓝线为选定的显著阈值线。
以上就是GWAS系列分享最后一期,知识新旧,永不过期。GWAS分析,虽已老矣,但是最新前沿的单细胞空间组学数据,还是能见到GWAS的身影。
新闻中心
News Senter
上海生物芯片有限公司
Shanghai Biochip Co., Ltd.
版权所有©上海生物芯片有限公司
电子邮箱:
marketing@shbiochip.com
地址: 上海市浦东新区张江高科技园区李冰路151号
技术电话:
4001002131
扫描查看
微信公众号