0
点赞
收藏
分享

微信扫一扫

GWAS数据分析专题

欢迎关注”生信修炼手册”!


全基因组关联分析是目前研究复杂疾病易感性的最有效手段之一,通过芯片或者高通量测序得到全基因组规模的SNP分析结果,再结合卡方,费舍尔精确检验,线性回归等统计方法,快速分析与表型相关联的SNP位点。本文整理了GWAS数据分析相关的资料。



GWAS芯片是常用的SNP分型平台,但是其位点相比全基因组还是不够,此时可以通过基因型填充技术提高SNP位点数目


  • ​​GWAS中的genotype imputation简介​​
  • ​​基因型填充中的phasing究竟是什么​​
  • ​​基因型填充前的质控条件简介​​
  • ​​使用shapeit进行单倍型分析​​
  • ​​使用Eagle2进行单倍型分析​​
  • ​​Haplotype Reference Consortium:最大规模的单倍型数据库​​
  • ​​使用IMPUTE2进行基因型填充​​
  • ​​使用Beagle进行基因型填充​​
  • ​​使用Minimac进行基因型填充​​
  • ​​文献解读|不同基因型填充软件性能的比较​​
  • ​​Michigan Imputation Server:基因型填充的在线工具​​


对分型结果进行质控后,就可以进行了GWAS分析了。GWAS的基本分析中设计到了卡方检验,费舍尔精确检验,线性回归,逻辑回归等统计方法


  • ​​卡方检验在关联分析中的应用​​
  • ​​费舍尔精确检验在关联分析中的应用​​
  • ​​Cochran-Armitage趋势检验在关联分析中的应用​​
  • ​​Cochran-Mantel-Haenszel检验在关联分析中的应用​​
  • ​​odd ratio值在关联分析中的含义​​
  • ​​线性回归的这些细节,你都搞明白了吗?​​
  • ​​没想到你是这个样子的置信区间​​
  • ​​逻辑回归or线性回归,傻傻分不清楚​​
  • ​​自己动手进行逻辑回归,你也可以!​​
  • ​​odd ratio置信区间的计算,你学会了吗?​​
  • ​​多元回归分析存在多重共线性了怎么办?​​


对于GWAS的分析结果,最常见的图表就是QQ图和曼哈顿图,以及locuszoom


  • ​​一文搞懂Q-Q plot图的含义​​
  • ​​3分钟掌握曼哈顿图的绘制​​
  • ​​曼哈顿图就够了吗?你还需要LocusZoom​​


传统的GWAS分析对象为SNP, 还可以进一步在gene, pathway等水平来进行关联研究


  • ​​GWAS大家都知道,Gene-Based GWAS你了解吗?​​
  • ​​3步搞定GWAS中的Gene Set Analysis​​
  • ​​GWAS做完了,下一步做什么?​​

meta分析可以整合多个gwas分析的结果,增大样本量,提高检验效能


  • ​​GWAS样本量不够怎么办,meta分析了解一下​​
  • ​​你没看错,搞定GWAS meta分析只需一行代码!​​
  • ​​meta分析的森林图不会画?看这里​​
  • ​​GWAMA:GWAS meta-analysis的又一利器​​
  • ​​点击鼠标即可完成GWAS meta分析,任何人都可以!​​
  • ​​用R进行gwas meta分析,原来如此简单​​


也可以将基因和基因之间的互作,基因和环境因素之间的互作考虑进来,一起分析


  • ​​基因型与表型的交互作用如何分析,多元回归来搞定​​
  • ​​你听说过Epistasis吗?​​
  • ​​GWAS中的Gene-Gene Interactions如何分析?看这里​​
  • ​​终于搞清楚了Lasso回归和Ridge回归的区别​​
  • ​​用R进行Lasso regression回归分析​​
  • ​​多因子降维法MDR分析GxG, GxE交互作用​​
  • ​​MDR多因子降维分析实战​​
  • ​​MDR的进阶版本-GMDR​​



GWAS除了识别与表型关联的位点,还有很多应用


  • ​​polygenic risk score:多基因风险评分​​
  • ​​使用PRSice进行多基因风险评分分析​​
  • ​​什么是SNP遗传力?​​
  • ​​LDSC:连锁不平衡回归分析​​
  • ​​LDSC分析实战​​
  • ​​不会linux也没关系,点击鼠标即可完成的LDSC分析来了​​
  • ​​想要进行gene prioritization分析,请看这里!​​
  • ​​衡量样本亲缘关系,除了IBD你还知道哪些方法?​​
  • ​​Linear Mixde Model:线性混合模型简介​​
  • ​​一文掌握inbreeding coefficient近交系数的计算​​
  • ​​使用GCTA的GREML评估SNP遗传力​​


GWAS经过这么多年的发展,有很多已发表的公开数据集被收录到数据库中


  • ​​GWAS ATLAS:最全面的GWAS数据库​​
  • ​​GWAS公开结果哪里找,GWAS Catalog来帮忙​​


GWAS要求的样本量很大,可以看到别人发表的高分文章中样本量在几千到几万的水平,整个实验的话费是比较高昂的。在GWAS的分析中,核心就是各种统计学方法的应用。

·end·

—如果喜欢,快分享给你的朋友们吧—


GWAS数据分析专题_数据库

举报

相关推荐

0 条评论