加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

RAxML-建立进化树

(2016-11-15 20:19:35)
标签:

bioinfo

分类: Bioinformatics
RAxML 是用极大似然法建立进化树的软件之一,可以处理超大规模的序列数据,包括 上千至上万个物种,几百至上万个已经比对好的碱基序列。
对于 Linux 和 Mac 用户下载  RAxML-7.0.4.tar.gz编译即可, make –f Makefile.gcc。Windows 用户可以下载编译好的  exe 文件,而无需安装。


数据的输入RAxML  的数据位  PHYLIP  格式

-s sequenceFileName  要处理的 phy 文件

-n outputFileName  输出的文件

-m substitutionModel  模型设定 方括号中的为可选项:

[-a weightFileName]  设定每个位点的权重,必须在同一文件夹中给出相应位点的权重

[-b bootstrapRandomNumberSeed]    设定 bootstrap 起始随机数

[-c numberOfCategories] 设定位点变化率的等级

[-d] -d 完全随机的搜索进化树,而不是从 maximum parsimony tree 开始。在 100 至 200 个分类单元间,该选可能会生成拓扑结构完全不同的局部最大似然树。

[-e likelihoodEpsilon]默认值为 0.1

[-E excludeFileName]  排除的位点文件名

[-f a|b|c|d|e|g|h|i|j|m|n|o|p|s|t|w|x] 算法

-f a rapid Bootstrap

-f b draw the bipartitions using a bunch of topologies

-f c checks if RAxML can read the alignment.

-f d rapid hill-climbing algorithm

-f e optimize the model parameters

-f g compute the per–site log Likelihoods for one ore more trees passed via -z.

-f h compute a log likelihood test (SH-test [21]) between a best tree passed via -t and a bunch of other trees passed via -z.

-f i performs a really thorough standard bootstrap
[-g groupingFileName]   预先分组的名称

[-h] program options

[-i initialRearrangementSetting] speccify an innitial rearrangement setting for the ininital phase of the search algorithm.

[-j]

[-k] optimize branchlength and model parameters on bootstrapped trees

[-l sequenceSimilarityThreshold]    Specify a threshold for sequence similarity clustering. [-L sequenceSimilarityThreshold]

[-M]   模型设定

-m GTRCAT: GTR approximation

-m GTRMIX: Search a good topology under GTRCAT

-m GTRGAMMA: General Time Reversible model of nucleotide subistution with the gamma model of rate heterogeneity.

-m GTRCAT_GAMMA:  Inference of the tree with site-specific evolutionary rates. 4 discrete GAMMA rates,

-m GTRGAMMAI: Same as GTRGAMMA, but with estimate of proportion of invariable sites

-m GTRMIXI: Same as GTRMIX, but with estimate of proportion of invariable sites.

-m GTRCAT GAMMAI: Same as GTRCAT_GAMMA, but with estimate of proportion of invariable sites.

-n outputFileName  输出文件名

-o outgroupName(s) 设定外类群  如果有两个以上外类群,两者之间不能用空格,而应该用英文的"," DNA, gen1=1-500 DNA, gen2=501-1000

[-p parsimonyRandomSeed] [-P proteinModel]

[-q multipleModelFileName]

-q multiple modelfile name

如将以下信息拷贝到另存为文件  genenames

DNA, rbcLa = 1-526

DNA, matK = 527-1472

调用方法  -q genenames

-m GTRGAMMA

[-r binaryConstraintTree]

-s sequenceFileName  待分析的 phy 文件

[-t userStartingTree]  用户指定的进化树拓扑结构

[-T numberOfThreads]

[-u multiBootstrapSearches] Specify the number of multiple BS searches per replicate to obtain betterML trees for each replicate. [-v] 版本信息

[-w workingDirectory] 将文件写入的工作目录

[-x rapidBootstrapRandomNumberSeed]    invoke rapidBootstrap

[-y] -y 只输出简约树拓扑结构,之后推出,该树也可以用于 GARLI 等软件

[-z multipleTreesFile]

[-#|-N numberOfRun]


 分析实例

若当前已经有比对好的序列,名为 test1.phy 文件

raxmlHPC -x 12345 -p 12345 -# 100 -m GTRGAMMA out1 -s test1.phy -f d   -q gennames -n TEST

将以上语句粘贴到记事本中,另存为 test1.bat 文件,保存到 raxmlHPC.exe 相同的文件夹,双击 test1.bat 即可运行。  运行结束后,程序将自动关闭。

-x 用快速方法进行 Bootstrap

-p 设定随机数

-# Bootstrap100 次

-m GTRGAMMA  模型

-o out1 将 out1 序列设置为外类群

-s test1.phy  输入的 phy 文件为  ex_al.phy

-n TEST  输出的各结果文件中包含 TEST

-q gennames  设定的基因的各位点分割位置

-f d    rapid hill-climbing algorithm

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有