标签:
gwas疾病稀有突变非加性遗传表观遗传 |
分类: GWAS |
我们知道GWAS有一个假设:common disease common variant(CDCV)hypothesis,即认为复杂性状主要是由不多的普遍存在的变异引起的,这些变异都有不低的贡献。然而在研究人类疾病等复杂性状时,却发现很多时候不满足这个假设。这给我们的研究带来了非常大的困难,甚至许多研究者对GWAS用于人类疾病等复杂性状抱怀疑或反对的态度。
图1很好的总结了GWAS不满足CDCV的情况。该图为GWAS常用的Manhattan图,横坐标为染色体位置,纵坐标不是显著性水平,而是该SNP对性状的贡献率。左上表示满足CDCV的情况,性状主要由不多的普遍存在于群体中的变异决定,每个变异的贡献率都不低(几个百分点)。这种情况下,GWAS能够很好的定位到关联位点。
http://s6/mw690/0065S4ZTgy6TMK6b3z755&690
图1 GWAS的遗传基础分类
标签:
gwas多重假设检验bonferronipermutationld |
分类: GWAS |
在上篇博文中提到,由于Marker之间存在LD,所以用Bonferroni校正对GWAS结果的错误发现率进行控制过于保守。而置换检验由于计算量太大,很难操作。既然Bonferroni校正的前提是每次试验独立,那么我们可不可以计算等效的独立SNP个数呢?
上篇博文中重画Q-Q图的思想就是一种方法,根据全基因组的LD-decay水平将基因组划分成若干block,block的个数就是等效的独立试验次数,那么校正后的显著水平应该为α/block数。但是这种方法过于粗糙,因为基因组局部的LD水平差异很大。下面介绍几种引用率较高的方法。
1. sampleM(Gao, Starmer et al. 2008)
该方法先建立任意两SNP之间的CLD(composite LD)矩阵,然后
标签:
gwasbonferronifdr置换检验permutation |
分类: GWAS |
在多重假设检验中,我们知道需要对错误率进行控制,我尽量简单说明原因:统计学中,我们作假设检验的前提是认为小概率事件在一次试验中不会发生。比如我们经常把显著性水平α设为0.05,也就是说,我们认为概率小于0.05的事件在一次试验中不会发生。但如果我们试验非常多次,那么小概率事件就极有可能发生了,所以在多重假设检验中,我们如果仍然把显著性水平设为0.05,那么假阳性事件会大大增多。
在GWAS分析中,我们对同一组表型数据,每一个分子标记(Marker,包括SNP或者SSR等等),都会作一次假设,即认为这个Marker会影响这个表型。这是典型的多重假设检验问题,所以需要对假阳性率进行控制。
由此在多重假设检验中提出了FDR,即错误发现率。对多重假设检验中的错误发现率的控制方法很多,在GWAS分析中,运用得最广泛的就是Bonferroni校正了,其原理是将原显著性水平(α)校正为α/M,M为检验的次数,在GWAS分析中为Marker数。
但是Bonferroni校正的前提是每次试验都是独立的。而在GWAS分析中,由于Marker之间存在连锁不平衡
标签:
bsaqtl性状定位分离群体分组分析测序 |
分类: BSA |
今天要分享的是BSA系列最后一个方法:QTL-seq(当然,BSA的方法远不止这些,但原理是相同的,不同的是实验设计)。
QTL-seq与之前的MutMap系列最大的不同在于研究的材料不同:MutMap是用诱变得到的材料,而QTL-seq可用于自然存在的材料。
QTL-seq的原理如图,我们将两个具有极端性状(如株高的高矮)的亲本杂交,得到F1,F1自交后得到性状分离的子代池F2,经过检验发现F2的性状成正态分布,说明这是一个数量性状。我们将F2中的极高和极矮个体分别混池测序,计算每个SNP位点的SNP-index(该位点与参考序列不同的reads数占总reads数的比例),然后将两个SNP-index相减得到ΔSNP-index,我们将ΔSNP-index显著偏离0的位点作为候选位点。
标签:
bsaqtl性状定位重测序生物信息学 |
分类: BSA |