R语言中的数组和列表

R语言中的数组与其它语言数组类似,它是一种高维的数据结构。维数过高运算会很不方便,所以用的很少,这里介绍是本着不落下任何知识点的目的。万一以后遇到了,虽然不方便,还是可以进行运算的。当然了,矩阵是二维数组,是数组的一种特殊形式。R中的列表是一种特殊的数组,每个元素又可以是一个列表可以含有多个元素,里面可以包含各种数据类型,故功能非常强大。

数组
数组有一个维数向量,可以定义数组的维数,通过array()进行创建数组如下:

> arr <- array(c(1:24),dim = c(2,3,4))
> dim(arr)
[1] 2 3 4
> arr
, , 1
     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6
, , 2
     [,1] [,2] [,3]
[1,]    7    9   11
[2,]    8   10   12
, , 3
     [,1] [,2] [,3]
[1,]   13   15   17
[2,]   14   16   18
, , 4
     [,1] [,2] [,3]
[1,]   19   21   23
[2,]   20   22   24
> class(arr)
[1] "array"

以上创建语句,第一个参数表示用1:24作为数组的数据,dim = c(2,3,4)表示数组维数为2x3x4。
我们也可以用下面这种方式定义数组:

> arr1 <- c(1:24)
> dim(arr1) <- c(2,3,4)
> arr1
, , 1
     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6
, , 2
     [,1] [,2] [,3]
[1,]    7    9   11
[2,]    8   10   12
, , 3
     [,1] [,2] [,3]
[1,]   13   15   17
[2,]   14   16   18
, , 4
     [,1] [,2] [,3]
[1,]   19   21   23
[2,]   20   22   24

> class(arr1)
[1] "array"

这种方式就是先指定向量c(1:24)为数组的数据,再指定其维数为2x3x4,最后其类型仍然为"array"。

矩阵的取块,其实与上节讲的矩阵取值一样。比如:

> arr[1,,]
     [,1] [,2] [,3] [,4]
[1,]    1    7   13   19
[2,]    3    9   15   21
[3,]    5   11   17   23

我们可以将数组转化为矩阵,比如我们尝试将arr这个数组转化为矩阵:

a <- as.matrix(arr)

猜测一下,a会长什么样?我们看一下,哈哈!

> a
      [,1]
 [1,]    1
 [2,]    2
 [3,]    3
 [4,]    4
 [5,]    5
 [6,]    6
 [7,]    7
 [8,]    8
 [9,]    9
[10,]   10
[11,]   11
[12,]   12
[13,]   13
[14,]   14
[15,]   15
[16,]   16
[17,]   17
[18,]   18
[19,]   19
[20,]   20
[21,]   21
[22,]   22
[23,]   23
[24,]   24
> dim(a)
[1] 24  1

竟然是一个24x1的矩阵,没想到吧。

列表
R中用list()创建列表,比如

> li <- list(c(1:3),c('a','b'),c(4:6))
> li
[[1]]
[1] 1 2 3
[[2]]
[1] "a" "b"
[[3]]
[1] 4 5 6

这个列表包含三个元素,分别是c(1:3),c('a','b'),c(4:6),而每个元素又是一个数据集合,我现在要取第一个元素的第三个元素(就是3)

> li[[1]][1]
[1] 1

取第一个元素,就是

> li[1]
[[1]]
[1] 1 2 3

列表的每个元素还是列表,同样说明列表可以嵌套。具体定位到最里层元素就是相应数据类型了:

> class(li[[1]][1])
[1] "integer"
> li[[2]][1]
[1] "a"
> class(li[[2]][1])
[1] "character"

我们可以给列表每个元素取一个名字

> names(li) <- c('a1','a2','a3')
> li
a1[1]123a1
[1] 1 2 3a2
[1] "a" "b"
$a3
[1] 4 5 6

为什么取名字呢,这样我们引用时可以直接利用美元符号“$”+名字‘a1’,’a2‘,‘a3’,而不需要写[[1]]那么麻烦了。

> lia1[1]123>lia1
[1] 1 2 3
> lia2[1]
[1] "a"

其实,给列表起名字还有更方便之处,这才是最终目的:可以在绑定数据后,直接引用列表元素名即可。
绑定列表用attach()

> attach(li)

然后,就可以直接引用列表元素名了。

> a1
[1] 1 2 3
> a2[2]
[1] "b"

关于R语言中的数组和列表(主要是列表)用法很灵活多样,在以后我们会有实战应用会用到。





作者:柯广的网络日志

微信公众号:Java大数据与数据仓库