加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

第四章  基因组注释  哪三个层次、各包含哪些内容   同源 Go

(2010-12-19 00:35:43)
标签:

杂谈

第三章

水稻拟南芥基因组特点

1pronounced  redundancy2chromosomal organization

 

第四章

基因组注释  三个层次、各包含哪些内容   同源   GO

1、基因组注释 Genome Annotation

利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释。

基因注释的任务是基因识别,核心是确定全基因组序列中所有基因的确切位置。

主要是三种方法:1)分析mRNAEST数据以直接得到结果

                2)通过相似性比对从已知基因和蛋白质序列得到间接证据

                3)基于各种统计模型和算法从头预测

2、 基因功能注释:利用已知功能的注释信息为新基因注释

     1)序列数据库相似性搜索

     2)序列模体(Motif)搜索

     3)直系同源聚类分析(Clusters of orthologous groupCOG

3、 基因注释的内容:1)测序,拼接,填补间隙;

                   2)读框测序,基因标注(序列中编码蛋白的基因区及调控区)

                   3)表达产物的出现(时间、部位、表达量)

                   4)非编码序列、非编码基因、非编码RNA

4、 注释的三个层次

A、 核酸水平的注释

1Mapping:根据DNA序列数据,把所有已知界标定位在基因组上。

2Gene finding:原核基因组---开放式阅读框(ORFs);真核基因组----复杂很多

1)直接的,序列高度匹配:同一或近缘物种中,与ESTcDNA,蛋白质等序列匹配

2)间接的,基于统计学的:从头测序

真核生物的基因预测:实践中多用两法的结合

①高级软件算法online version

②相似性搜索(同源性搜索):优点是为新基因指定可能的功能,不足是相似性搜索中数据常不完全,和会出现假阳性的结果;

3) 非编码RNAs和调控区

4) 识别重复元素

B.蛋白质水平的注释:把生物有机体的蛋白质(基因)归类到不同的家族中,并给它们定名及指定可能的功能。

COG systemNCBI,2000)直向同源蛋白的鉴别和分群

2COG注释的具体内容、三个层次(核酸、pr、静止及其工作)

COG:直向同源蛋白的鉴别和分群

3、直系同源(Orthologs 直向同源、垂直同源)

来自于不同物种的有垂直家系(物种形成)进化而来的蛋白,并且典型的保留与原始蛋白相同的功能。

4、旁系同源(Paralogs 并系同源、横向同源)

指那些在一定物种中的来源于基因复制的蛋白,可能会进化出新的与原来有关的功能。

5GO及其分析

GOGene Ontology):描述基因/蛋白质的功能。包含了基因参与的生物学过程、所出的细胞位置、发挥的分子功能三方面功能信息:

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有