加载中…
个人资料
青山屋主
青山屋主
  • 博客等级:
  • 博客积分:0
  • 博客访问:136,055
  • 关注人气:38
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
博文
标签:

教育

分类: 生物信息

标准偏差:标准偏差(Std Dev, Standard Deviation) 等于标准差。 

 

标签:

r语言

分类: 生物信息
#2.R语言的基本数据结构
#R语言中最近的数据是向量vector,其类型可分为
#整数型integer
#实数型real
#复数型complex
#字符型string
#逻辑logical
#字节raw
#2.1向量的赋值
x<-c(10,2,5,4,6,38)
assign('x',c(10,2,5,4,6,38)) #等价于上文
y<-c(x,0,x) #多重构造,利用x构造y
#2.2向量的基本运算
#原则1向量的每一个元素都进行相应的运算2结果长度等于最长长度,短向量的数据会从头再开始使用
z<- 2*x
z2<- x+y
z3<- x+1

#基本运算符+,-,*,/对应加减乘除
#<,>,<=,>= 大于,小于,大于等于,小于等于
# %/% 整除
# %% 求余数
#abs绝对值,sqrt平方根
#简单统计函数:sum求和,min最小值,max最大值,mean平均值,

sort(x) #返回x的元素从小到大排序的结果向量
order(X) #返回使得x从小到大排列的元素的下标向量。x[or
标签:

r语言

分类: 生物信息
3章 3.1访问数据框变量
setwd('D:/RworkDir')
Squid<- read.table(file='squid.txt', header=TRUE)
names(Squid) #what are the varibale names?查看我们正在处理的变量的名称
str(Squid) #显示数据框中每个变量的属性
#数据框中的变量不能直接访问,比如上面我们建立的Squid数据框中的变量:Sample,Year等变量是不能直接访问的。那么该如何访问呢?有三种方法,1$,2data参数,3attach函数
#1.函数中的data参数
M1<- lm(GSI ~ factor(Location)+factor(Year), data=Squid) #根据变量Location,Year做GSI的线性回归,lm是线性回归函数。#data=是表示在数据框Squid中可以找到数据。但是不是所有的函数都支持data参数。

#2.对于不支持data参数的函数,如何访问数据框中的变量呢?第一个方法是$符号,用法:数据框名$变量名
Squid$GSI #显示数据框Squid中的变量GSI
#第二种方法是选择相应的列,或者是行
Squid[, 6] #显示数据框Squid中的第六列,正好是GSI
#3.attach函数
attach(Squid) #把Squ
标签:

r语言

分类: 生物信息
前段时间为了快速掌握R语言以及Bioconductor的应用,看了很多杂书。但是欲速则不达,尽管书看了不少,收获却没多少,因此静下心来返回去从头学习。幸好找到了一本非常适合初学者的《R语言初学者指南》,看了几天收获不小。以下是该书第二章中的两个习题,贴在这里与大家分享!


#练习2.1
LengthCT<- c(75,85,91.6,95,NA,105.5,106)   #新建一个向量变量,其中包含NA
LengthCT                                   #显示该向量
LengthCT[ 1:5]                             #显示该向量1到5号元素
length(LengthCT)                           #显示向量LengthCT的长度
LengthCT[ -2]                              #显示该向量除第2个元
分类: 生物信息
Bioconductor相关R语言学习例4-1
在该例中,主要学习dna序列转换的几个命令。进行DNA转RNA(转录),RNA转DNA(逆转录),互补,反向,反向互补,翻译等基本操作。


> source('http://www.bioconductor.org/biocLite.R')   #下载biocLite安装脚本
Bioconductor version 2.14 (BiocInstaller 1.14.2), ?biocLite for help
> biocLite('Biostrings')                             #安装bioconductor中的Biostrings软件包
BioC_mirror: http://bioconductor.org
Using Bioconductor version 2.14 (BiocInstaller 1.14.2), R version
  3.1.0.
Installing package(s) 'Biostrings'
试开URL’http://bioconductor.org/packages/2.14/bioc/bin/windows/contrib/3.1/Biostrings_2.32.0.zip'
Content type 'application/zip' length 4750742 bytes (4.5 Mb)
打开了URL
downloaded 4.5 Mb

(2014-05-24 13:05)
分类: 生物信息
Bio-linux系统的安装

       绝大多数的生物信息学分析都是在Linux系统下进行的,尤其是测序数据的mapping,拼接,组装等操作涉及的tophat,bowtie以及cufflink软件包,都在在Linux系统环境下运行的。因此,建立一个Linux系统环境,对于学习生物信息是必不可少的。
      目前已经有很多种适合生物信息分析使用的Linux系统,我个人比较喜欢Bio-Linux系统,因此选择了它作为今后的主要系统。
      Bio-linux由NERC Environmental Bioinformatics Centre开发并维护系统。官网及介绍:http://nebc.nerc.ac.uk/tools/bio-linux.

Bio-linux系统提供了多种多样的安装和使用方式,为初学者和教学演示提供了极大的便利。安装方式包括作为唯一系统安装,双系统安装, live方式安装,虚拟机安装。各种方式的选择可参考
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有