加载中…
个人资料
Krebs
Krebs
  • 博客等级:
  • 博客积分:0
  • 博客访问:2,331
  • 关注人气:95
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
博文
标签:

orthomcl

download

mcl

protein

family

更新:由于问问题的人较多,也没太多时间去一一回复,如果有需求的同学或者老师,本人可有偿代为完成相关分析,Email:bioinforservice@gmail.com,望理解。

 

    一直都想总结一下,以前自己做过、用过的一些东西,仔细一想,又不知该从何总结起,就捡最近的说起吧,先介绍下Orthomcl.

-----

1.Orthomcl是用来干嘛的?

  我们都知道,我们在注释完一些基因组后,会拿到大量的蛋白,而这些蛋白,孤零零的放在那,你不觉得别扭吗?除了常规的pfam、interpro做完了,再做点什么呢?聚个类,找个家族,看看家族水平上的进化什么的貌似也蛮不错,今天就介绍一下如何利用orthomcl来做蛋白家族吧。

OrthoMCL groups proteins into “ortholog groups.” That name is a little misleading
because the groups contain proteins related by:
orthology (recent descent)
in-paralogy (rece

标签:

clustal

clustalx

clustalw

使用说明

下载地址

操作

杂谈

   今天由于检验Assemble的需要。。突然间要对几个序列进行多序列比对,一下子有些忘了该怎么做,就模模糊糊的知道Clustalw以前用过,细节什么的都没印象了。。Google了一下,仔细重新温习了下以前的内容,什么都明白了。。。
   顺便整理下做个小总结,一方面给自己留个存根,免得下次遇到再到处搜,另一方面也希望对你有所帮助~
1.先提供下载地址:
  官方下载地址:http://www.clustal.org/download/current/
  Clustalx、Clustalw的各种最新版本都能下载到,包括linux、Win、Mac...
http://s16/middle/5d1edf6a07794021a77df&690
2.原理:序列同源性分析:

&

(2011-05-19 11:09)
标签:

r

超几何分布

杂谈

超几何分布在生物学中有重要应用,常被用来做各种富集分析,同时它和Fisher精确检验有着千丝万缕的联系,掌握超几何分布是编写Fisher精确检验的基础。
想做超几何分布的同学,希望对你有用。。
在R语言中dhyper四个参数的含义分别如下:
x: the number of white balls drawn without replacement from an urn which contains both black and white balls.
m: the number of white balls in the urn
n:  the number of black balls in the urn
k:  number of balls drawn from the urn

在scipy中stats.hypergeom.pmf (cdf, sf)等大多数均可接受4个参数,但是与dhyper的四个参数不一样,了解它们的差异才能让我们更好地去掌握和应用。

有以下2乘2列联表
=========
a=2    b=23
c=5    d=30
=========
(注:该例子来自【美】伯纳德.罗斯纳 著  孙尚拱 译  《生物统计学基础》第五版) P355.
1
标签:

soap

使用说明

拼接

杂谈

基于第二代测序平台的广泛使用使得物种基因组的测序工作有了突飞猛进的发展。目前,华大基因研究院新开发了一种基于短片段组装的软件SOAP,现在把使用方法介绍给给位需要的朋友们。

引用henry_by 的 soap使用方法

Usage:  soap [options]

       -a  <str>   query a file, *.fq or *.fa format

       -d  <str>   reference sequences file, *.fa format

标签:

matlab

导入数据

方法

教育

最方便的方法:
一、MATLAB数据输入很简单:菜单-->FILE-->import data.搞定(可从excel ,txt中导入);
二、变量工作区有一个导入数据的按钮直接点击使用即可导入;
三、在工作区直接新建变量,然后用复制粘贴功能即可,新建变量进行编辑时就想excel一样简单操作。

还有三种方法,也是非常常用:
方法1: 
将数据直接粘贴 .m 文件中或者粘贴到 .txt 中,放在当前工作目录下,用load 来调用,文件名就是变量名。
导 出时用,save命令,一种是临时保存二进制文件在工作区方便以后程序用,另一种需要一asc文件倒出来,写文章那个用,方法如下: save 'b.txt' B -ascii %(把矩阵B的数据,导出到了TXT文件中,名字为b.txt),注意空格,-ascii 前有空格。

方法二:
先粘贴同一中,然后再 用dlmread函数来调用,A=dlmread('data.m') 。注意单引号。

方法三:
从cecel中直接导入用xlsread函数,eg: a=xlsread('yi.xlsx')。 同样注意 单引号。
导出时使用  
标签:

中科院

生物化学

考研

真题

杂谈

中科院1999年生物化学A

标签:

考研

遗传学

名词解释

杂谈

第十三章 遗传与发育               


 

标签:

考研

遗传学

名词解释

杂谈

第十章 遗传物质的分子基础               


 

标签:

考研

遗传学

名词解释

杂谈

第七章 染色体变异                  


 

标签:

杂谈

 

  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有