第四章 基因组注释 哪三个层次、各包含哪些内容 同源 Go
(2010-12-19 00:35:43)
标签:
杂谈 |
第三章
水稻、拟南芥基因组特点
1、pronounced
第四章
基因组注释
1、基因组注释 Genome Annotation
利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释。
基因注释的任务是基因识别,核心是确定全基因组序列中所有基因的确切位置。
主要是三种方法:1)分析mRNA和EST数据以直接得到结果
2、 基因功能注释:利用已知功能的注释信息为新基因注释
3、 基因注释的内容:1)测序,拼接,填补间隙;
4、 注释的三个层次
A、 核酸水平的注释
1)Mapping:根据DNA序列数据,把所有已知界标定位在基因组上。
2)Gene finding:原核基因组---开放式阅读框(ORFs);真核基因组----复杂很多
(1)直接的,序列高度匹配:同一或近缘物种中,与EST,cDNA,蛋白质等序列匹配
(2)间接的,基于统计学的:从头测序
真核生物的基因预测:实践中多用两法的结合
①高级软件算法online version;
②相似性搜索(同源性搜索):优点是为新基因指定可能的功能,不足是相似性搜索中数据常不完全,和会出现假阳性的结果;
3) 非编码RNAs和调控区
4) 识别重复元素
B.蛋白质水平的注释:把生物有机体的蛋白质(基因)归类到不同的家族中,并给它们定名及指定可能的功能。
COG system(NCBI,2000)直向同源蛋白的鉴别和分群
2、COG注释的具体内容、三个层次(核酸、pr、静止及其工作)
COG:直向同源蛋白的鉴别和分群
3、直系同源(Orthologs 直向同源、垂直同源)
来自于不同物种的有垂直家系(物种形成)进化而来的蛋白,并且典型的保留与原始蛋白相同的功能。
4、旁系同源(Paralogs 并系同源、横向同源)
指那些在一定物种中的来源于基因复制的蛋白,可能会进化出新的与原来有关的功能。
5、GO及其分析
GO(Gene Ontology):描述基因/蛋白质的功能。包含了基因参与的生物学过程、所出的细胞位置、发挥的分子功能三方面功能信息: