加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

使用sortmerna软件从宏转录组数据里面过滤rRNA数据

(2015-04-16 13:42:35)
分类: 生物信息学
1:软件网址:http://bioinfo.lifl.fr/RNA/sortmerna/,建议直接编译好的二进制文件,下载后目录结构如下:
使用sortmerna软件从宏转录组数据里面过滤rRNA数据
2: 软件本身包含rRNA数据库,数据库列表如下,位于rRNA_databases:
使用sortmerna软件从宏转录组数据里面过滤rRNA数据

3:首先对数据库建立index,命令如下:

./indexdb_rna --ref  ./rRNA_databases/silva-bac-23s-id98.fasta,./rRNA_databases/silva-bac-23s-id98.idx

建立index可以单独建立,也可以多个多数据库一起建立,命令如下:

使用sortmerna软件从宏转录组数据里面过滤rRNA数据

4:合并与分解文件

该软件的输入与输出为一个文件(fastq or fasta),因此即使你是双端测序,也要合并成一个文件,合并命令如下:

 

 ./merge-paired-reads.sh forward-reads.fastq reverse-reads.fastq outfile.fastq

对于输出的一个文件的拆解命令如下:

./unmerge-paired-reads.sh merged-reads.fastq forward-reads.fastq reverse-reads.fastq 

这两个脚本在软件中我没有找到,但是可以在网上下载到,网址如下:https://github.com/biocore/sortmerna/tree/master/scripts

5:过滤宏基因组的rRNA数据

./sortmerna --ref ./rRNA_databases/silva-euk-28s-id98.fasta,./silva-euk-28s-id98.idx --reads H01_shuffle.fastq --sam --num_alignments 1 --fastx --aligned H01_rRNA --other H01_no_rRNA.fasta

期间可以添加多个数据库中间用“:”隔开

使用sortmerna软件从宏转录组数据里面过滤rRNA数据

6:由于版本的原因SortMeRNA version 2.1, 01/02/2016,需要说明一下:

SortMeRNA 是基于单端的数据去做分析的,存在一端比对上,另一端比对不上的情况,这种情况下,可以选择参数:

--paired_in 则将两端的数据都算作rRNA

--paired_out 则将两端的数据都不算做rRNA





0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有