加载中…
个人资料
菜鸟
菜鸟
  • 博客等级:
  • 博客积分:0
  • 博客访问:1,697,722
  • 关注人气:806
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
公告
本博客纯属网上学习交流
搜博主文章
评论
加载中…
留言
加载中…
我的好朋友
连接
我的连接
好友
加载中…
访客
加载中…
博文
分类: linux学习
直接读取 一个gz压缩文件

我直接创建了一个内容:'asdfasdfasfd' 的 1.txt文件并用gzip 压缩。读取:$ zcat  1.txt.gz asdfasdfasfd如果内容过长可以接 less 查看:$ zcat  1.txt.gz | less

或者

zcat  XXXX.gz | grep -n

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2018-09-24 19:48)
分类: 生物信息资源
对基因突变可以从不同角度分类。实际上,突变是无法从单系统分类的,因为它的因果、状态、过程等各方面既有区别又有联系。
(一)  按突变生成的过程分:
1 、自发突变
指在没有人工特设的诱变条件下,由于外界环境条件的自然作用或生物体内生理生化变化而发生的突变。如:1910年Morgan 在大量的野生型的红眼果蝇中发现一只白眼突变的果蝇,这种由红眼突变为白眼就是自发突变。
2、 诱发突变
指生物体在特定的物理、化学、生物的诱变因素的影响下发生的改变。如:水稻品种原丰早就是通过60Co--γ射线处理水稻,使其产生变异再加以选择而育成的新品种。
(二)   按DNA碱基序列改变的性质来分
1、 碱基置换
可以分为两类,一类是转换(transition)即嘌呤到嘌呤,嘧啶到嘧啶的变化;另一类是颠换(transversion),即嘌呤到嘧啶,或嘧啶到嘌呤的变化。
2 、碱基插入(base insertion): 造成移码突变(frameshift mutation)
3 、碱基缺失(base deletion)
插入或缺失一个或两个碱基都会引起移码突变,扁平的碱性染料分子嵌合到DNA分子中也常引起移码突变。移码突变不但改变
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
分类: 生物信息资源
http://genome.cse.ucsc.edu/gtexBodyMap.html

其中包含来自gtex数据的v6版本的,44个人类组织。位置信息比较详细,尤其对于人脑的描述。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
分类: 生物信息资源
一,plink二进制格式基因型数据格式说明:
http://www.cog-genomics.org/plink/2.0/input#pgen
PLINK 1 binary

--bfile [prefix]

The --bfile flag normally causes the binary fileset prefix.bed + prefix.bim + prefix.fam to be referenced. (The structure of these files is described in the PLINK 1.9 file formats appendix.).

PLINK 2 supports Zstandard compression of large text files. You can use the 'vzs'

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
分类: 生物信息资源

转自:http://www.cnblogs.com/freemao/p/6414898.html

一, Hapmap Format

前11列是SNP的attributes, 其余列是 nucleotides observed at each SNP for each individuals。tab 分隔. 

第一行是header

每一行代表一个SNP。

Genotypic data 可以是double bit 也可以是single bit(IUPAC code)。

missing data 用NN for double bit 或者N for single bit.

 

 

 二, Numeric format

由于genotype file (GD file)里没有SNP位置信息,因此需要一个额外的map file(GM file)。GM file里的SNP顺序需要个GD中的保持一致。&

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
博客2年3月没更新了,但是已经有100多万的访问量了,哈。没想到!2016年继续加油!
  • 博客等级:
  • 博客积分:1266积分
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

http://www.pnas.org/content/110/24/9851.abstract

http://research.nhgri.nih.gov/CGD/

Abstract

Technological advances have greatly increased the availability of human genomic sequencing. However, the capacity to analyze genomic data in a clinically meaningful way lags behind the ability to generate such data. To help address this obstacle, we reviewed all conditions with genetic causes and constructed the Clinical Genomic Database (CGD) (http://research.nhgri.nih.gov/CGD/), a searchable, freely Web-accessible database of conditions based on the clinical utility of genetic diagnosis and the availability of specific medical interve

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
http://www.nature.com/nrg/journal/v12/n7/box/nrg3012_BX3.html
http://www.insilicase.co.uk/agile/guide/AgileAnnotator.aspx
AgileAnnotator identifies sequences that have been aligned to the protein-coding sequences or to regions within 50 bp of a splice junction. Each read is then screened for sequence mismatches and insertions or deletions highlighted in its corresponding “CIGAR” data field in the SAM file. A position is called only if at least 5 reads for the two most common alleles are mapped to the position. A position is called as heterozygous if 10% or more of the reads identify the minor allele. The variant-calling algorithm is designed to be promiscuous, since the final cut-off parameters are set interactively later, using AgileVariantViewer.

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2013-08-04 10:08)
分类: 生物信息资源
http://www.genome.jp/kegg-bin/show_organism?menu_type=pathway_maps&org=hsa

KEGG pathway maps

Metabolism
Global and overview maps
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
R计算二项Binomial分布的P问题,R中有四个函数
pbinom(q,size,prob),计算累积概率
dbinom(x,size,prob),计算取某个值的特定概率
rbinom(n, size, prob),产生n个b(size,prob)的二项分布随机数
qbinom(p, size, prob),quantile function 分位数函数。

假定在一次实验中,事件A发生的概率为0.1,那么进行11次这样的实验,观察到4次的概率是多少?
答案是Binomial Probability: P(X = 4)= dbinom(4,11,0.1)
[1] 0.0157838

观察到小于等于4次的概率是多少?
Cumulative Probability: P(X < =4)= pbinom(4,11,0.1)
[1] 0.997249


阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有