加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

NCBI的使用(二)——蛋白序列的搜索

(2014-05-02 15:21:22)
标签:

杂谈

摘要:前一篇提到了如何用NCBI的BLAST功能来确定某一个蛋白究竟属于哪一类蛋白,在最后提到对于难以通过BLAST和保守区区分的超家族蛋白,画进化树不失为一种可行的方法。画进化树需要有其它物种中同种或同一基因超家族的蛋白或核酸序列,怎样去找这些序列大家会认为是件很容易的事,但是会遇到想要找的蛋白或核酸序列却找不到的情况吗?下面以蛋白序列为例,简单讲讲怎样在NCBI里较快找到你想要找的特定物种的某蛋白序列。

首先进入NCBI,选择Protein,在其右侧的框中输入你要找的蛋白名称,如果要找某一具体物种中的该蛋白,直接空一格输入物种名称的可以了,但如果要找的是某一大类物种的该蛋白,比如哺乳动物,或者蓝藻的该蛋白,那么其实也可以直接将名称直接输入,或者是仅仅输入蛋白的名称,就开始搜索。搜索结果出来后点右侧窗口Top Organisms右边的Tree,我很喜欢用这种方法,因为这样不仅可以方便找到想要特定界门纲目科属种的该蛋白序列,而且可以通过Tree了解这种蛋白在生物界的大致分布。另外很多物种可能会有几个名字,用这种方法也能较好地避免因为物种有多个名字而导致搜索结果不全或有误。另外,这个Tree本身就是在画进化树选择物种的一个极其好的参考,我们可以大致参照这个Tree来选择进化树中要放的物种。需要提醒的是,在很多物种,特别是菌里面,几个登录号其蛋白序列是完全一致,或者仅仅有一两个氨基酸不同,这有时候是因为是从不同菌株中测序得到的结果,在进化树中有时候是不需要重复选择的。

通过这个Tree,还可以了解到到底哪些物种跟自己正在做的物种关系比较近,在很多方面都是由参考价值的,特别是有些物种中该蛋白的研究已经比较深入,更是应该好好研究和借鉴他人的研究成果。在构建进化树时,最理想的应当是包含所有的物种,但这种树事实上是不可能存在的,通过NCBI的这个Tree,我们可以根据自己研究的需要来选择要放入我们进化树中的物种。

根据我个人构建进化树的经验,这棵Tree,特别是对于进化分析的进化树,真的是非常重要,如果用于建树的蛋白分布较小,可能会完全囊括这棵Tree中所有物种,或某一类中所有物种的蛋白序列,再将自己构建的进化树结果和这棵Tree中的结果进行比较,你会发现很多有意思的东西。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有