【教程】简易的arlequin进行DNA序列的Amova分析教程

标签:
杂谈 |
分类: 教程 |
简易的arlequin进行DNA序列的Amova分析教程
需要软件:
Mega, DNAsp, arlequin
可选:notepad(可用记事本代替)
1,序列比对
用mega打开.fas格式的序列,进行比对(muscle)。完成后,在mega比对结果页面data->export
alignment->fasta format,把结果另存到一个地方(另存的地方,所有路径名最好没有中文也没有空格。
2,haptype的提取
打开DNAsp,file->open data file,
对序列进行分组:data->define sequence sets,在新出现的页面:
对于每一个居群,把它所有的序列都挑到右侧之后,点add new sequence
set,在新弹出的窗口输入居群名。
所有居群都定义好了之后,点击updata all
entries, 然后关闭窗口。
然后file->save/export data file as->arlequin
format, 最后会存两个文件,一个.hap格式,一个.arp格式。
3,把数据弄进arlequin
DNAsp生成的.arp文件格式有问题,arlequin不一定识别,可能和版本有关,因此需要自己生成.arp模版并填写。
3.1 生成新工程的.arp文件的模板
打开arlequin, 在标签页project
wizard里,点browse,在弹出窗口中输入一个新的project的名字(.arp格式)。
在下面进行一些设置。对于数据包括若干地区、每个地区若干居群的线粒体DNA,datatype选DNA,勾上genotypic
data,No. of samples为居群的总数。点击create
project,即可在刚才browse的地方找到新的文件。
3.2 把DNAsp生成的东西填进.arp模板
用notepad打开刚arlequin才生成的.arp模板、DNAsp生成的.hap文件和DNAsp生成的.arp文件。
3.2.1 在:
# HaplList={
#
h1 ATC
#
h2 ATT
#
.
#
.
#
.
#
}
这一段,把中括号中间的东西替换成.hap文件里的东西,去掉所有的#号。
3.2.2 把模板的[[Samples]]后面的东西,全部换成DNAsp生成的.arp文件中[[Samples]]后面的东西。
保存文件。
3.3 在arlequin里设置分组
在arlequin里,open project->选择刚才手动制作的.arp文件,打开。
此时,在project标签下,应该能看到列出的居群名。看到不就说明刚才的文件没写好。
切换到structor
editor标签,在每个prolation前面,双击group对应的空白,填写所属的group名(该居群所属的地理分区)。全改完后,一定点击下面的update
project。
group填写好update之后,在project标签下,除了居群名,还会看到分组情况。
4,在arlequin中进行分析并查看结果
接上面。在settings标签页下,把要做的分析都勾上(例如amova),点击右上角的“Start”按钮,等待分析完成(amova很快)。完成后,在刚才制作的.arp文件夹下,有对应名称的.res结尾的文件夹。一堆结果文件都在这里。一般,这里直接用notepad查看.xml文件即可,所有结果都在这里。
之后如果还要再进行别的分析的话,再次点击"start“,所有的结果会被追加到这个.xml文件末尾。
例如AMOVA的结果: