Grch38/hg38与b37/hg19
(2019-01-16 09:22:51)分类: 生物信息学 |
1:首先说Grch38/hg38之间没有本质区别,b37/hg19也没有本质上区别,好像就是在染色体的编号上一个使用的是chr1,另一个使用的是数字1.
2:如果要实现hg19到hg38使用的工具liftOver,还有一个是映射文件,映射文件可以从http://hgdownload.cse.ucsc.edu/gbdb/hg19/liftOver/下载,还有我在call变异的时候GATK提供的是b37版本的vcf文件,我需要转换为hg19,需要用到映射文件b37tohg19.chain(http://bioinfo5pilm46.mit.edu/software/GATK/resources/)
3:简单的转换命令:
java -jar ~/Picard/picard.jar LiftoverVcf \ I=af-only-gnomad.raw.sites.b37.vcf \ O=af-only-gnomad.raw.sites.hg19.vcf \ CHAIN=b37tohg19.chain \ REJECT=rejected_variants.vcf \ R=~/hg19_annotation/ucsc.hg19.fasta
4:一些相关的映射文件的下载地址:
http://crossmap.sourceforge.net/#
5:一些可以下载的数据库链接
构建h19的序列:ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/hg19/ucsc.hg19.fasta.gz
前一篇:微卫星不稳定性MSI