马克社区,马克吐温社区,马克java社区R语言学习之矩阵

R语言学习之矩阵

很多人是在线性代数课学的矩阵，当时什么问题都没有，除了一个问题：学习矩阵到底有什么用呢？矩阵是一个集合，它里面可以存放很多对象，比如一个行就是一个对象（或者说记录），每一个对象又有很多（属性）列。如果把一组对象~属性表示成矩阵，我们就能很容易取出每个对象对应的某个属性了，并且根据线性代数方法考察两个对象之间的联系（相似性）。矩阵的行列数我们一般称作维数。

对于矩阵而言，我们当然想实现以下操作与功能：

矩阵的加减、乘除运算
矩阵的行列切片
最值的快速获取
线性代数运算

好在R语言中的矩阵可以很轻易帮我们实现这些功能，有了这一神兵利器，我们就可以游刃有余地操作应该算是数据分析的基本单位——矩阵了。

创建矩阵

R中直接调用函数matrix()可以快速自定义矩阵，下面一行命令可以快速创建一个4行3列的矩阵：

>a<-matrix(c(1:12),nrow=4,ncol=3,byrow=TRUE)
> a
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12

这里相当于先创建一个向量，再将其转化为一个4x3的矩阵，bynow=TRUE表示会按照把第一行排满，接着排第二行。

还有一些其它小技巧，比如有时候我们需要初始化一个矩阵，以便于后面对其进行赋值：

> a1<-matrix(0,3,4)
> a1
     [,1] [,2] [,3] [,4]
[1,]    0    0    0    0
[2,]    0    0    0    0
[3,]    0    0    0    0

矩阵行、列、元素的选取（切片）

取第一行第二列元素

> a[1,2]
[1] 2

取第一行元素，这与Matlab很相像

> a[1,]
[1] 1 2 3

取第一行除了第二个元素之外的元素

> a[1,-2]
[1] 1 3

取第一列元素

> a[,1]
[1]  1  4  7 10

取第一列除了第二个元素之外的元素

> a[-2,1]
[1]  1  7 10

矩阵全部元素

> a[,]
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12

矩阵的基本运算

这里创建一个新的矩阵b、c1，b与a的维数相同，c1的列、行数与a的行、列数分别相等，便于做实验。

> b<-matrix(c(13:24),nrow=4,ncol=3,byrow = TRUE)
> b
     [,1] [,2] [,3]
[1,]   13   14   15
[2,]   16   17   18
[3,]   19   20   21
[4,]   22   23   24
> c1<-matrix(c(13:24),nrow=3,ncol=4,byrow = TRUE)
> c1
     [,1] [,2] [,3] [,4]
[1,]   13   14   15   16
[2,]   17   18   19   20
[3,]   21   22   23   24

获取矩阵维数

> dim(a)
[1] 4 3

加减法运算

矩阵的加减法运算表示两个矩阵对应元素分别进行加减法运算，返回两个矩阵对应元素分别进行加减法运算的矩阵。当然了，矩阵加减法运算前提是两个矩阵的维数必须一样，否则会报错。

> a+b
     [,1] [,2] [,3]
[1,]   14   16   18
[2,]   20   22   24
[3,]   26   28   30
[4,]   32   34   36

乘除法运算

> a*b
     [,1] [,2] [,3]
[1,]   13   28   45
[2,]   64   85  108
[3,]  133  160  189
[4,]  220  253  288

矩阵的乘除法运算表示两个矩阵对应元素分别进行乘除法运算，返回两个矩阵对应元素分别进行乘除法运算的矩阵。当然了，矩阵乘除法运算前提是两个矩阵的维数必须一样，否则会报错。

还有就是矩阵的乘法，要求是前面矩阵的列数等于后面矩阵的列数，返回一个左边矩阵行数x右边矩阵列数的矩阵。

> a%*%c1
     [,1] [,2] [,3] [,4]
[1,]  110  116  122  128
[2,]  263  278  293  308
[3,]  416  440  464  488
[4,]  569  602  635  668

线性代数运算

R语言提供了很多用于线性代数运算的函数，常用的列出如下：

eigen() #求特征值和特征向量

solve() #求逆矩阵

chol() #Choleski分解

svd() #奇异值分解

qr() #QR分解

det() #求行列式

dim() #给出行列数

t() #矩阵转置

矩阵的拼接

R语言矩阵的拼接主要用到两个函数，rbind()、cbind()

按行拼接要求两个矩阵列数要相同rbind()

> rbind(a,b)
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12
[5,]   13   14   15
[6,]   16   17   18
[7,]   19   20   21
[8,]   22   23   24

按列拼接要求两个矩阵行数要相同cbind()

> cbind(c1,matrix(c(1:6),nrow = 3,byrow = TRUE))
     [,1] [,2] [,3] [,4] [,5] [,6]
[1,]   13   14   15   16    1    2
[2,]   17   18   19   20    3    4
[3,]   21   22   23   24    5    6

其它函数的灵活结合

矩阵相关计算求法还可以灵活应用其它函数，比如求和函数sum()，平均值函数mean()，最值函数max()等。

> a
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12
> max(a)
[1] 12

第一行最大值

>max(a[1,])
[1] 3
> max(a[,1])
[1] 10

对第一行求和

> sum(a[1,])
[1] 6
> mean(a[,1])
[1] 5.5

还有就是结合apply()函数，后面会讲到。

用法，举个例子。apply(Matrix,1,FUN=mean)，这里，FUN=mean计算矩阵Matrix每一行的平均值，以向量的形式返回,中间的参数‘1’表示求每一行均值，如果是‘2’，表示求每一列均值

比如：

求a每一行平均值

> apply(a,1,mean)
[1]  2  5  8 11

对a每一列分别求和

> apply(a,2,sum)
[1] 22 26 30

好了，关于矩阵就讲到这里，希望对你们有用。下次会讲数组哦，尽情期待！

作者：柯广的网络日志

微信公众号：Java大数据与数据仓库

其他

创建矩阵

矩阵行、列、元素的选取（切片）

矩阵的基本运算

矩阵的拼接

其它函数的灵活结合