R语言数据分析系列之一，数据分析系列之一

文章由LinuxBoy分享于2019-03-27 08:03:14热评（70）

R语言数据分析系列之一

写在前面：关于R的优势网上已经很多了，略去不表，这里只表干货。

这是我第一篇关于R的博客，打算写个系列教程，带领你一步一步进入R的神奇世界，最后用一个例子做实战讲解，希望能够分享给您，也为您的工作带来某些益处，您的支持是我的动力，谢谢。

> x <- c(1:10)

> x

[1] 1 2 3 4 5 6 7 8 9 10

> mode(x)

[1] "numeric"

> x <- 100 +1i

> x

[1] 100+1i

> mode(x)

[1] "complex"

> x <- c(sample(1:10,5))

> x

[1]  2  3  8  7 10

> x <- x==3

> x

[1] FALSE  TRUE FALSE FALSE FALSE

> mode(x)

[1] "logical"

第一行用采样的方式随机创建一个向量，并用来判断该项量与3的值是否相等，结果赋值给x

> x <- 'comaple.zhang'

> x

[1] "comaple.zhang"

> mode(x)

[1] "character"

> nchar(x)

[1] 13

> x <- sample(1:5,10,replace=T)

> x

[1] 2 4 4 4 4 1 5 4 1 2

> x <- as.factor(x)

> x

[1] 2 4 4 4 4 1 5 4 1 2

Levels: 1 2 4 5

因子类型很有用， 其中的levels代表着你的因子的水平，即：去重以后的类别。在你处理数据集分类的时候就方便多了。当你改变你的因子level的时候，你会发现你的数据其实也跟着改变了如下：

> levels(x)

[1] "1" "2" "4" "5"

> levels(x)[3] <- 't'

> x

[1] 2 t t t t 1 5 t 1 2

Levels: 1 2 t 5

推荐文章：