R语言数据分析系列之一,数据分析系列之一


R语言数据分析系列之一

—— by comaple.zhang

 写在前面:关于R的优势网上已经很多了,略去不表,这里只表干货。

这是我第一篇关于R的博客,打算写个系列教程,带领你一步一步进入R的神奇世界,最后用一个例子做实战讲解,希望能够分享给您,也为您的工作带来某些益处,您的支持是我的动力,谢谢。

数据类型

numeric 数值型

> x <- c(1:10)

> x 

[1]  1  2 3  4  5  6  7 8  9 10

> mode(x) 
[1] "numeric"

 

complex 复数类型

 

> x <- 100 +1i 
> x 
[1] 100+1i 
> mode(x) 
[1] "complex"

 

logical 逻辑型

> x <- c(sample(1:10,5)) 
> x 
[1]  2  3  8  7 10 
> x <- x==3 
> x 
[1] FALSE  TRUE FALSE FALSE FALSE
> mode(x) 
[1] "logical"
 
第一行用采样的方式随机创建一个向量,并用来判断该项量与3的值是否相等,结果赋值给x

character 字符型

> x <- 'comaple.zhang' 
> x 
[1] "comaple.zhang" 
> mode(x) 
[1] "character"
> nchar(x) 
[1] 13

factor 因子型

> x <- sample(1:5,10,replace=T) 
> x  
[1] 2 4 4 4 4 1 5 4 1 2 
> x <- as.factor(x) 
> x  
[1] 2 4 4 4 4 1 5 4 1 2 
Levels: 1 2 4 5
因子类型很有用, 其中的levels代表着你的因子的水平,即:去重以后的类别。在你处理数据集分类的时候就方便多了。当你改变你的因子level的时候,你会发现你的数据其实也跟着改变了如下:
> levels(x) 
[1] "1" "2" "4" "5"
> levels(x)[3] <- 't'
> x  
[1] 2 t t t t 1 5 t 1 2 
Levels: 1 2 t 5
 

相关内容