使用sortmerna软件从宏转录组数据里面过滤rRNA数据

分类: 生物信息学 |
./indexdb_rna
--ref
建立index可以单独建立,也可以多个多数据库一起建立,命令如下:
4:合并与分解文件
该软件的输入与输出为一个文件(fastq or fasta),因此即使你是双端测序,也要合并成一个文件,合并命令如下:
对于输出的一个文件的拆解命令如下:
./unmerge-paired-reads.sh merged-reads.fastq
forward-reads.fastq reverse-reads.fastq
这两个脚本在软件中我没有找到,但是可以在网上下载到,网址如下:https://github.com/biocore/sortmerna/tree/master/scripts
5:过滤宏基因组的rRNA数据
./sortmerna --ref ./rRNA_databases/silva-euk-28s-id98.fasta,./silva-euk-28s-id98.idx --reads H01_shuffle.fastq --sam --num_alignments 1 --fastx --aligned H01_rRNA --other H01_no_rRNA.fasta
期间可以添加多个数据库中间用“:”隔开
6:由于版本的原因SortMeRNA version 2.1, 01/02/2016,需要说明一下:
SortMeRNA 是基于单端的数据去做分析的,存在一端比对上,另一端比对不上的情况,这种情况下,可以选择参数:
--paired_in 则将两端的数据都算作rRNA
--paired_out 则将两端的数据都不算做rRNA