【线性代数】矩阵第一讲：矩阵与矩阵的运算

前言

矩阵基础

矩阵的定义

矩阵的维度

矩阵的表示法

矩阵的元素

特殊的矩阵

行矩阵

列矩阵

方阵

主对角线

斜对角线

单位阵

单位阵性质

数量阵

上三角矩阵

下三角矩阵

零矩阵

梯形阵

矩阵的运算

矩阵相等

矩阵加法

注意

性质

矩阵减法

矩阵乘法

可乘性

计算规则：“左行乘右列”

重要性质（与数的乘法不同）

方阵的幂

定律

转置矩阵

基本性质

对称矩阵

前言

前面我们通过几何关系引入了矩阵以及矩阵乘法（传送门：https://blog.csdn.net/weixin_38357164/article/details/158415735?fromshare=blogdetail&sharetype=blogdetail&sharerId=158415735&sharerefer=PC&sharesource=weixin_38357164&sharefrom=from_link），这一篇内容我们主要认识一下矩阵和矩阵的计算，后续将持续更新学习内容，欢迎有兴趣的朋友一起学习共同进步！~~~。

矩阵基础

矩阵的定义

在数学中，矩阵是一个按照矩形阵列排列的复数或实数集合。更简单地说，矩阵就是一个由行和列组成的数字表格。它通常用大写粗体字母（如 A、B）来表示。由mxn个数按一定的次序排成的m行n列的矩形数表称为mxn的矩阵，简称矩阵。

在几何意义上，矩阵表示向量经过一次线性变换，结合二维平面最好理解，也就是一个向量n（x，y）在经过一次线性变换后变成一个新的向量n1（x1，y1），两个向量n和n1的基向量不同。但原点不变。

矩阵的维度

矩阵的大小由它的行数和列数决定，我们称之为维度或阶，如果一个矩阵有 m 行和 n 列，我们就称它为 m×n 矩阵（读作“m 乘 n矩阵”）。

矩阵的表示法

一个矩阵通常用圆括号或方括号将数字阵列括起来。手写的时候一定用圆括弧，印刷体的时候用一般会用中括弧。通常用大写粗体字母（如 A、B）来表示。例如矩阵 A 是一个 m×n矩阵（m行n列），如下所示：

$A = \\begin{pmatrix} a_{11} & a_{12} & \\cdots & a_{1n} \\\\ a_{21} & a_{22} & \\cdots & a_{2n} \\\\ \\vdots & \\vdots & \\cdots & \\vdots \\\\ a_{m1} & a_{m2} & \\cdots & a_{mn} \\end{pmatrix}$

元素为实数的称为实矩阵，实际上只讨论实矩阵。

如果矩阵很大，可使用矩阵简单的表示方法： $A=\\left(a_{i j}\\right)_{m \\times n}$

矩阵的元素

矩阵中的每个数字称为矩阵的元素（或项）。我们通常使用矩阵名称的小写字母，并加上两个下标来表示元素的位置。

第一个下标表示行号。
第二个下标表示列号。

例如，对于矩阵 A，元素 aij 表示位于第 i 行、第 j 列的元素。

$a_{11}$ =1（第1行第1列）
$a_{12}$ =2（第1行第2列）
$a_{23}$ =6（第2行第3列）

因此，一个一般的 m×n 矩阵可以写成

$A = \\begin{pmatrix} a_{11} & a_{12} & \\cdots & a_{1n} \\\\ a_{21} & a_{22} & \\cdots & a_{2n} \\\\ \\vdots & \\vdots & \\cdots & \\vdots \\\\ a_{m1} & a_{m2} & \\cdots & a_{mn} \\end{pmatrix}$

特殊的矩阵

行矩阵

只有一行的矩阵（1×n矩阵）。例如 [1 2 3]，写为： $(a_{11}\\quad a_{12}\\quad \\cdots\\quad a_{1n})$

列矩阵

只有一列的矩阵（m×1 矩阵）。例如 $\\begin{bmatrix} 1 \\\\ 2 \\\\ 3 \\end{bmatrix}$ ，写为： $\\begin{pmatrix} a_{11} \\\\ a_{21} \\\\ \\vdots \\\\ a_{m1} \\end{pmatrix}$

方阵

当m=n时，即矩阵的行数与列数相同时，称矩阵为方阵。

主对角线

只有方阵才有主对角线。从矩阵左上角到右下角，由所有行下标 = 列下标的元素组成的对角线。

$A_{n \\times n} = \\begin{pmatrix} a_{11} & a_{12} & \\cdots & a_{1n} \\\\ a_{21} & a_{22} & \\cdots & a_{2n} \\\\ \\vdots & \\vdots & \\ddots & \\vdots \\\\ a_{n1} & a_{n2} & \\cdots & a_{nn} \\end{pmatrix}$

斜对角线

从矩阵的右上角（第 1 行第 n 列）延伸到左下角（第 n 行第 1 列）。斜对角线上的元素位置满足：行下标 + 列下标 = n + 1。即： $a_{i,n+1-i} \\quad (i = 1, 2, \\dots, n)$ 。

$A_{n \\times n} = \\begin{pmatrix} a_{11} & a_{12} & \\cdots & a_{1(n-1)} & a_{1n} \\\\ a_{21} & a_{22} & \\cdots & a_{2(n-1)} & a_{2n} \\\\ \\vdots & \\vdots & \\ddots & \\vdots & \\vdots \\\\ a_{(n-1)1} & a_{(n-1)2} & \\cdots & a_{(n-1)(n-1)} & a_{(n-1)n} \\\\ a_{n1} & a_{n2} & \\cdots & a_{n(n-1)} & a_{nn} \\end{pmatrix}$

单位阵

它的主对角线上的元素全为 1，其余所有元素全为 0，就得到又一个特殊的矩阵叫做单位阵，，记为 E_n 或 L_n 。

单位阵性质

对任意可乘矩阵 A，则有： $A E_n = A,\\quad E_m A = A$

转置不变： $E_n^T = E_n$

幂等性： $E_n^k = E_n$ （任意正整数 k）

数量阵

它的主对角线上的元素全为 k，其余所有元素全为 0，就得到又一个特殊的矩阵叫做数量阵

上三角矩阵

主对角线以下的元素全为零的方阵，对于一个矩阵 U，如果当 i>j（即行号大于列号，也就是主对角线以下的元素）时，有 $u_{ij} = 0$ ，那么 U就是一个上三角矩阵。

下三角矩阵

对于一个矩阵 L，如果当 i<j（即行号小于列号，也就是主对角线以上的元素）时，有 $l_{ij} = 0$ ，那么 LL就是一个下三角矩阵

零矩阵

所有元素都是0的矩阵，零矩阵用大写的O表示。

$O_{m \\times n} = \\begin{pmatrix} 0 & \\cdots & 0 \\\\ \\vdots & \\ddots & \\vdots \\\\ 0 & \\cdots & 0 \\end{pmatrix}$

梯形阵

设 $A = (a_{ij})_{m \\times n}$ 为非零矩阵，若非零行(即至少有一个非零元素的行)全在零行的上面，A中各非零行中第一个(最后一个)非零元素前(后)面零元素的个数随行数增大而增多(减少)，则称为上(下)梯形矩阵。简称为上(下)梯形阵。

矩阵的运算

矩阵相等

两个矩阵 A 和 B 称为相等，记作 A = B，当且仅当它们满足以下两个条件：

维度相同：矩阵 A 和 B 必须有相同的行数和相同的列数（即同为 m×n 矩阵）。

对应元素相等：对于所有的 i 和 j （1≤i≤m，1≤j≤n），矩阵 A 的第 i 行第 j 列的元素 $a_{ij}$ 等于矩阵 B 的第 i 行第 j 列的元素 $b_{ij}$ 。

换句话说，两个矩阵相等意味着它们作为数学对象是完全一样的，没有任何区别。

矩阵加法

设 $A=(a_{ij})$ 和 $B=(a_{ij})$ 是两个 m×n 矩阵（即行数、列数相同）。它们的和 A+B 是一个 m×n 矩阵 $C=(a_{ij})$ ，其中 C 的每个元素等于 A 和 B 对应位置元素之和：

$c_{ij} = a_{ij} + b_{ij} \\quad (1 \\leq i \\leq m,\\ 1 \\leq j \\leq n).$

例如 $\\mathbf{A} = \\begin{bmatrix} 1 & 2 \\\\ 3 & 4 \\end{bmatrix}, \\quad \\mathbf{B} = \\begin{bmatrix} 5 & 6 \\\\ 7 & 8 \\end{bmatrix}.$

结果为： $\\mathbf{A} + \\mathbf{B} = \\begin{bmatrix} 1 + 5 & 2 + 6 \\\\ 3 + 7 & 4 + 8 \\end{bmatrix} = \\begin{bmatrix} 6 & 8 \\\\ 10 & 12 \\end{bmatrix}$

注意

只有同型矩阵才能相加。如果两个矩阵的行数或列数不同，则它们的和没有定义。
加法运算可以推广到多个矩阵相加，只要它们都是同型的。

性质

交换律：A+B=B+A。

结合律：(A+B)+C=A+(B+C)。

存在零矩阵：存在一个 m×n 的零矩阵 0（所有元素为零），使得 A+0=A。

存在负矩阵：对于每个矩阵 A，存在唯一的矩阵 −A（称为 A 的负矩阵），其元素是 A 对应元素的相反数，满足 A+(−A)=0。

矩阵减法

利用负矩阵，可以定义矩阵减法： $\\mathbf{A} - \\mathbf{B} = \\mathbf{A} + (-\\mathbf{B})$

矩阵乘法

矩阵乘法是线性代数中最核心的操作之一，但它的计算规则和意义可能与大家熟悉的数的乘法有很大不同。矩阵乘法并不是两个同维数的矩阵对应元素相乘。我们通常说的矩阵乘法是指一般矩阵乘积（也称为点积或内积相乘）。

可乘性

并不是任意两个矩阵都能相乘。
设矩阵 A 的尺寸为 m×n（m 行 n 列），矩阵 B 的尺寸为 p×q。只有当 A 的列数等于 B 的行数时，即 n=p，A 和 B 才能相乘。

计算规则：“左行乘右列”

假设我们计算 C=A×B，结果矩阵 C 的尺寸是 m×q（A 的行数，B 的列数）。如何求 C中第 i 行第 j 列的元素 $c_{ij}$ 。例如我有两个矩阵A和B相乘，那么结果如下：

$A_{m\\times s}B_{s\\times n} = C_{m\\times n}$

取 A 的第 i 行的每一个元素，取 B 的第 j 列的每一个元素，将它们对应相乘，然后求和。如果换成公式就是： $c_{ij} = a_{i1}b_{1j} + a_{i2}b_{2j} + \\dots + a_{is}b_{sj} = \\sum_{k=1}^s a_{ik}b_{kj}$ ，其中 n 是 A 的列数（也是 B 的行数）。

设矩阵 A 和 B 如下： $A = \\begin{bmatrix} 1 & 2 \\\\ 3 & 4 \\end{bmatrix}, \\quad B = \\begin{bmatrix} 5 & 6 \\\\ 7 & 8 \\end{bmatrix}$

计算 C=A×B：

第一行第一列： $C_{11}$ =1×5+2×7=5+14=19
第一行第二列： $C_{12}$ =1×6+2×8=6+16=22
第二行第一列： $C_{21}$ =3×5+4×7=15+28=43
第二行第二列： $C_{22}$ =3×6+4×8=18+32=50

结果为： $C = \\begin{bmatrix} 19 & 22 \\\\ 43 & 50 \\end{bmatrix}$

重要性质（与数的乘法不同）

矩阵乘法有很多违反直觉的性质，这是初学者容易出错的地方。

不满足交换律：通常 A×B = B×A。有时 AXB 有意义，但 BXA可能根本不能乘（因为维度对不上）。即使都能乘，结果也往往不同。如下所示
不满足数乘法定律：例如 AB=AC，但是B和C不一定相等。如下所示
满足结合律：(AB)C=A(BC)，前提是维度允许。
满足分配律：A(B+C)=AB+AC。
零因子存在：两个非零矩阵相乘，结果可能是零矩阵，如下所示

$\\begin{bmatrix} 1 & 1 \\\\ 1 & 1 \\end{bmatrix} \\times \\begin{bmatrix} 1 & 1 \\\\ -1 & -1 \\end{bmatrix} = \\begin{bmatrix} 0 & 0 \\\\ 0 & 0 \\end{bmatrix}$

方阵的幂

只有方阵才能算幂，设 A 是 n 阶方阵，k 是正整数则有 $A^k = \\underbrace{A\\cdot A\\cdot \\dots \\cdot A}_{k\\text{}}$

定律

$A^k A^l = A^{k+l},\\quad (A^k)^l = A^{kl}$

一般来说 $(AB)^k \\neq A^k B^k$ ，因为矩阵乘法不满足交换律。但如果 AB=BA，等式成立。

转置： $(A^k)^T = (A^T)^k$

转置矩阵

将一个 m×n 的矩阵 A 的行和列互换，得到的 n×m 的新矩阵称为 A 的转置矩阵，记作 A^T （或 A′）。

元素关系：如果 B = A^T ，那么 B 中第 i 行第 j 列的元素等于 A 中第 j 行第 i 列的元素。即 $(A^T)_{ij} = A_{ji}$

基本性质

双重转置等于原矩阵： (A^T)^T = A

和的转置等于转置的和： (A + B)^T = A^T + B^T

数乘的转置： (kA)^T = kA^T

乘积的转置（反转顺序）： (AB)^T = B^T A^T

推导一下 (AB)^T = B^T A^T ，设 $A = (a_{ij})_{m \\times s}$ ，根据矩阵的可乘性质那么 $B = (b_{ij})_{s \\times n}$ ，所以矩阵A和B的转置矩阵为： $A^T = (a_{ji})_{s \\times m} \\quad B^T = (b_{ji})_{n \\times s}$ ，那么就有 $C = AB = (c_{ij})_{m \\times n} \\quad B^T A^T = (d_{ij})_{n \\times m}$ ，我们可以发现矩阵C的转置就是nxm，和 B^TA^T 的nxm相同。然后只要明证矩阵的对应元素相同即可，即证明 $C_{ji}=d_{ij}$ 即可，因为 $c_{ji} = a_{j1}b_{1i} + a_{j2}b_{2i} + \\dots + a_{js}b_{si}$ ， $d_{ij} = b_{1i}a_{j1} + b_{2i}a_{j2} + \\dots + b_{st}a_{js}$ ，所以对应元素也会相同。