加载中…
个人资料
菜鸟
菜鸟
  • 博客等级:
  • 博客积分:0
  • 博客访问:1,455,480
  • 关注人气:775
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
公告
本博客纯属网上学习交流
搜博主文章
评论
加载中…
留言
加载中…
我的好朋友
连接
我的连接
好友
加载中…
访客
加载中…
博文
分类: 生物信息资源
一,plink二进制格式基因型数据格式说明:
http://www.cog-genomics.org/plink/2.0/input#pgen
PLINK 1 binary

--bfile [prefix]

The --bfile flag normally causes the binary fileset prefix.bed + prefix.bim + prefix.fam to be referenced. (The structure of these files is described in the PLINK 1.9 file formats appendix.).

PLINK 2 supports Zstandard compression of large text files. You can use the 'vzs'

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
分类: 生物信息资源

转自:http://www.cnblogs.com/freemao/p/6414898.html

一, Hapmap Format

前11列是SNP的attributes, 其余列是 nucleotides observed at each SNP for each individuals。tab 分隔. 

第一行是header

每一行代表一个SNP。

Genotypic data 可以是double bit 也可以是single bit(IUPAC code)。

missing data 用NN for double bit 或者N for single bit.

 

 

 二, Numeric format

由于genotype file (GD file)里没有SNP位置信息,因此需要一个额外的map file(GM file)。GM file里的SNP顺序需要个GD中的保持一致。&

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
博客2年3月没更新了,但是已经有100多万的访问量了,哈。没想到!2016年继续加油!
  • 博客等级:
  • 博客积分:1266积分
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

http://www.pnas.org/content/110/24/9851.abstract

http://research.nhgri.nih.gov/CGD/

Abstract

Technological advances have greatly increased the availability of human genomic sequencing. However, the capacity to analyze genomic data in a clinically meaningful way lags behind the ability to generate such data. To help address this obstacle, we reviewed all conditions with genetic causes and constructed the Clinical Genomic Database (CGD) (http://research.nhgri.nih.gov/CGD/), a searchable, freely Web-accessible database of conditions based on the clinical utility of genetic diagnosis and the availability of specific medical interve

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
http://www.nature.com/nrg/journal/v12/n7/box/nrg3012_BX3.html
http://www.insilicase.co.uk/agile/guide/AgileAnnotator.aspx
AgileAnnotator identifies sequences that have been aligned to the protein-coding sequences or to regions within 50 bp of a splice junction. Each read is then screened for sequence mismatches and insertions or deletions highlighted in its corresponding “CIGAR” data field in the SAM file. A position is called only if at least 5 reads for the two most common alleles are mapped to the position. A position is called as heterozygous if 10% or more of the reads identify the minor allele. The variant-calling algorithm is designed to be promiscuous, since the final cut-off parameters are set interactively later, using AgileVariantViewer.

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2013-08-04 10:08)
分类: 生物信息资源
http://www.genome.jp/kegg-bin/show_organism?menu_type=pathway_maps&org=hsa

KEGG pathway maps

Metabolism
Global and overview maps
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
R计算二项Binomial分布的P问题,R中有四个函数
pbinom(q,size,prob),计算累积概率
dbinom(x,size,prob),计算取某个值的特定概率
rbinom(n, size, prob),产生n个b(size,prob)的二项分布随机数
qbinom(p, size, prob),quantile function 分位数函数。

假定在一次实验中,事件A发生的概率为0.1,那么进行11次这样的实验,观察到4次的概率是多少?
答案是Binomial Probability: P(X = 4)= dbinom(4,11,0.1)
[1] 0.0157838

观察到小于等于4次的概率是多少?
Cumulative Probability: P(X < =4)= pbinom(4,11,0.1)
[1] 0.997249


阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

杂谈

分类: 生物信息资源
/data/safe/soft/sratoolkit.2.1.16-centos_linux64/bin/fastq-dump

sra是NCBI 推出的存储高通量数据的格式,而平常我们工作用得多是fastq格式。如果需要把sra 转成fastq,则
http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?cmd=show&f=software&m=software&s=software,直接下载sratoolkit.2.1.16-centos_linux64,解压就可以用sratoolkit.2.1.16-centos_linux64/bin/fastq-dump

然后使用如下命令行:
/data/safe/soft/sratoolkit.2.1.16-centos_linux64/bin/fastq-dump SRR034580.sra
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2012-11-08 21:23)
标签:

杂谈

分类: 杂谈

PDF插入图片

今天接到任务,需要在一个pdf文档里插入签名,签名,我当然是已经扫描好图片,现在的问题是如何在pdf里插入这个图片。

如果是word,就很简单,但是pdf里,没有插入图片的选项。研究了一下。

工具-注释里面有个图章工具(stamps),创建一个新图章,用你的图片,然后用图章盖上就可以了,

创建完,再选择一下,就ok。倒是非常不错。

不过你实际插入的图片,不知道为什么,会显示比实际大,你可以调整一下,我这次就把原来的图片大小打印出来

在屏幕上比较,调整成真实大小。

zhuan http://hi.baidu.com/chenshake/item/e42dc4b8f4db25eb4fc7fd97

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2012-11-05 13:25)
标签:

杂谈

分类: linux学习
问题:http://bbs.chinaunix.net/thread-1599629-1-1.html
file1
a
b
c


file2
1
2
3


如何合并两个文件,得到
a 1
b 2
c 3
解决办法:paste file1 file2 > result-file

命令小窍门-如何将两个文件按行合并

就是把 文件 1 中的第一行加到 文件 2 第一行的行尾,
文件 1 的第二行加到 文件 2 第二行行尾,以此类
paste --delimiters='\n' 1.txt 2.txt

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 不良信息反馈 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有