加载中…
个人资料
菜鸟
菜鸟
  • 博客等级:
  • 博客积分:0
  • 博客访问:15,333
  • 关注人气:812
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
博文
分类: R语言学习

http://zoonek2.free.fr/UNIX/48_R/09.html
使用R计算相关系数的函数为:

cor.test(X,Y,method='')

method可以为'spearman','pearson' and 'kendall',分别对应三种相关系数的计算和检验。

1 perrson相关系数

 > n <- 10
> x <- rnorm(n)
> y <- rnorm(n)

> cor(x,y)
[1] -0.4132864

> cor.test(x,y)
Pearson's product-moment correlation
data: x and y
t = -1.2837, df = 8, p-value = 0.2352
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.8275666 0.2924366
sample estimates:
cor
-0.4132864

上面给出了相关系数的可信度区间和P-value

2 spearman相关系数和
kendall相关系数

同上,只要把method改成spearman和
(2018-09-24 19:48)
分类: 生物信息资源
对基因突变可以从不同角度分类。实际上,突变是无法从单系统分类的,因为它的因果、状态、过程等各方面既有区别又有联系。
(一)  按突变生成的过程分:
1 、自发突变
指在没有人工特设的诱变条件下,由于外界环境条件的自然作用或生物体内生理生化变化而发生的突变。如:1910年Morgan 在大量的野生型的红眼果蝇中发现一只白眼突变的果蝇,这种由红眼突变为白眼就是自发突变。
2、 诱发突变
指生物体在特定的物理、化学、生物的诱变因素的影响下发生的改变。如:水稻品种原丰早就是通过60Co--γ射线处理水稻,使其产生变异再加以选择而育成的新品种。
(二)   按DNA碱基序列改变的性质来分
1、 碱基置换
可以分为两类,一类是转换(transition)即嘌呤到嘌呤,嘧啶到嘧啶的变化;另一类是颠换(transversion),即嘌呤到嘧啶,或嘧啶到嘌呤的变化。
2 、碱基插入(base insertion): 造成移码突变(frameshift mutation)
3 、碱基缺失(base deletion)
插入或缺失一个或两个碱基都会引起移码突变,扁平的碱性染料分子嵌合到DNA分子中也常引起移码突变。移码突变不但改变
分类: 生物信息资源

转自:http://www.cnblogs.com/freemao/p/6414898.html

一, Hapmap Format

前11列是SNP的attributes, 其余列是 nucleotides observed at each SNP for each individuals。tab 分隔. 

第一行是header

每一行代表一个SNP。

Genotypic data 可以是double bit 也可以是single bit(IUPAC code)。

http://images2015.cnblogs.com/blog/635312/201702/635312-20170219103000785-1506057908.png

missing data 用NN for double bit 或者N for single bit.

http://images2015.cnblogs.com/blog/635312/201702/635312-20170219102640457-761716220.png

 

http://images2015.cnblogs.com/blog/635312/201702/635312-20170220102701148-2065643518.png

 

标签:

细菌

杂谈

分类: 生物信息资源

第一个:http://genome.jgi-psf.org/

 

第二个:http://mbgd.nibb.ac.jp/ 

MBGD is a database for comparative analysis of completely sequenced microbial genomes, the number of which is now growing rapidly. The aim of MBGD is to facilitate comparative genomics from various points of view such as ortholog identification, paralog clustering, motif analysis and gene order comparison.

标签:

选择

基因

上下游

NCBI

杂谈

分类: 生物信息资源

最近研究6个疾病基因,需要在NCBI下载基因序列及其上下游1000bp序列,经朋友推荐,方法如下:

以基因BRAF为例

第一步:在NCBI的gene中输入BRAF(human)如下:

 

标签:

杂谈

分类: 生物信息资源

链接:http://www.medsci.cn/sci/journal_class.asp?classname=�񾭿�ѧ

缩写名/全名 ISSN号 所属类别 杂志级别 影响因子* 投稿参考 主页      
NAT REV NEUROSCI  详 评 文 介   
nature reviews neuroscience 1471-0048 神经科学 第1级 29.51 投稿经验
主页
     
ANNU REV NEUROSCI  详 评 文 介   
annual review of neuroscience 0147-006X 神经科学 第1级 26.756 投稿经验
主页
     
BEHAV BRAIN SCI  详 评 文 介   
behavioral and brain sciences 0140-525X 神经科学 第1级 21.952 投稿经验
主页
   

标签:

translate

dna

to

protein

杂谈

分类: 生物信息资源
一个DNA翻译成蛋白质,直接粘贴DNA序列
http://www.expasy.org/tools/dna.html

多个DNA翻译成蛋白质,上传一个FASTA格式文件即可:
http://www.ebi.ac.uk/Tools/emboss/transeq/index.html

标签:

r

读入

文件

读出

杂谈

分类: R语言学习
问题1:
本人有一个文件,内容如下:
rs3094315 1 742429 0.3015
rs12562034 1 758311 0.7966
rs12124819 1 766409 0.2822
rs4475691 1 836671 0.0364
rs28705211 1 890368 0.0820
rs13303118 1 908247 0.8978
rs9777703 1 918699 0.0132
rs3121567 1 933331 0.1803
rs3934834 1 995669 0.2985
rs9442372 1 1008567 0.0649
rs3737728 1 1011278 0.6199
rs6687776 1 1020428 0.1092
rs9651273 1 1021403 1.7824
rs4970405 1 1038818 0.5863
命名为ex.txt,第四列是卡方值,我想把第四列转化为p值,用R写了以下程序:
> data<-read.table('ex.txt')
> for (i in 1:14) { result[i, 1] <- (1-pchisq(data[i, 4], 1))}; write.table (result, '1.txt')
但是老是提示:

错误于result[i, 1] <- (1 - pchisq(data[i, 4], 1)) : 找不到对象'result'
请高手赐教,
标签:

zlib.h

没有

杂谈

分类: linux学习
安装maq时出现以下问题:
[root@localhost maq-0.7.1]# make
make  all-am
make[1]: Entering directory `/data/safe/soft/maq-0.7.1'
gcc -DHAVE_CONFIG_H -I.     -Wall -m64 -D_FASTMAP -DMAQ_LONGREADS -g -O2 -c bfa.c
bfa.c:1:18: 错误:zlib.h:没有那个文件或目录
make[1]: *** [bfa.o] 错误 1
make[1]: Leaving directory `/data/safe/soft/maq-0.7.1'
make: *** [all] 错误 2

解决方法:
在网上查询了一下:主要问题是zlib-devel-1.1.4-8.i386.rpm没装,安装zlib-devel即可
[root@localhost maq-0.7.1]# yum install zlib-devel
Loaded plugins: fastestmirror, priorities
Loading mirror speeds from cached hostfile
 * addons: mirrors.163.com
 * base: mirrors.163.com
 * extras: mirrors.163.com
 * updates: mirrors.163.com
Setting up Install Process
Resolving Dependencies
--> Running transaction check
---> Package zlib-devel.i386 0:1.2.3-3 set
标签:

linux

查看文件

文件夹

大小

杂谈

分类: linux学习

Linux查看文件夹大小

du -sh 查看当前文件夹大小

du -sh * | sort -n 统计当前文件夹(目录)大小,并按文件大小排序

附送:

du -sk filename 查看指定文件大小

 

Linux:ls以K、M、G为单位查看文件大小

Linux:ls以K、M、G为单位查看文件大小。
#man ls
……
-h, --human-readable
print sizes in human readable format (e.g., 1K 234M 2G)
……
# ls
cuss.war nohup.out
# ls -l
total 30372
-rw-r--r-- 1 root root 31051909 May 24 10:07 cuss.war
-rw------- 1 root root 0 Mar 20 13:52 nohup.out
# ls -lh
total 30M
-rw-r--r-- 1 root root 30M May 24 10:07 cuss.war
-rw------- 1 root root 0 Mar 20 13:52 nohup.out
# ll -h
total 30M

  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有