云计算百科
云计算领域专业知识百科平台

【线性代数】矩阵第一讲:矩阵与矩阵的运算

目录

前言

矩阵基础

矩阵的定义

矩阵的维度

矩阵的表示法

矩阵的元素

特殊的矩阵

行矩阵

列矩阵

方阵

主对角线

斜对角线

单位阵

单位阵性质

数量阵

上三角矩阵

下三角矩阵

零矩阵

梯形阵

矩阵的运算

矩阵相等

矩阵加法

注意

性质

矩阵减法

矩阵乘法

可乘性

计算规则:“左行乘右列”

 重要性质(与数的乘法不同)

方阵的幂

定律

转置矩阵

基本性质

对称矩阵


前言

前面我们通过几何关系引入了矩阵以及矩阵乘法(传送门:https://blog.csdn.net/weixin_38357164/article/details/158415735?fromshare=blogdetail&sharetype=blogdetail&sharerId=158415735&sharerefer=PC&sharesource=weixin_38357164&sharefrom=from_link),这一篇内容我们主要认识一下矩阵和矩阵的计算,后续将持续更新学习内容,欢迎有兴趣的朋友一起学习共同进步!~~~。

矩阵基础

矩阵的定义

在数学中,矩阵是一个按照矩形阵列排列的复数或实数集合。更简单地说,矩阵就是一个由行和列组成的数字表格。它通常用大写粗体字母(如 A、B)来表示。由mxn个数按一定的次序排成的m行n列的矩形数表称为mxn的矩阵,简称矩阵。

在几何意义上,矩阵表示向量经过一次线性变换,结合二维平面最好理解,也就是一个向量n(x,y)在经过一次线性变换后变成一个新的向量n1(x1,y1),两个向量n和n1的基向量不同。但原点不变。

矩阵的维度

矩阵的大小由它的行数和列数决定,我们称之为维度或阶,如果一个矩阵有 m 行和 n 列,我们就称它为 m×n 矩阵(读作“m 乘 n矩阵”)。

矩阵的表示法

一个矩阵通常用圆括号或方括号将数字阵列括起来。手写的时候一定用圆括弧,印刷体的时候用一般会用中括弧。通常用大写粗体字母(如 A、B)来表示。例如矩阵 A 是一个 m×n矩阵(m行n列),如下所示:

$A = \\begin{pmatrix} a_{11} & a_{12} & \\cdots & a_{1n} \\\\ a_{21} & a_{22} & \\cdots & a_{2n} \\\\ \\vdots & \\vdots & \\cdots & \\vdots \\\\ a_{m1} & a_{m2} & \\cdots & a_{mn} \\end{pmatrix}$

元素为实数的称为实矩阵,实际上只讨论实矩阵。

如果矩阵很大,可使用矩阵简单的表示方法:A=\\left(a_{i j}\\right)_{m \\times n}

矩阵的元素

矩阵中的每个数字称为矩阵的元素(或项)。我们通常使用矩阵名称的小写字母,并加上两个下标来表示元素的位置。

  • 第一个下标表示行号。

  • 第二个下标表示列号。

例如,对于矩阵 A,元素 aij​ 表示位于第 i 行、第 j 列的元素。

  • a_{11}=1(第1行第1列)

  • a_{12}​=2(第1行第2列)

  • a_{23}=6(第2行第3列)

因此,一个一般的 m×n 矩阵可以写成

$A = \\begin{pmatrix} a_{11} & a_{12} & \\cdots & a_{1n} \\\\ a_{21} & a_{22} & \\cdots & a_{2n} \\\\ \\vdots & \\vdots & \\cdots & \\vdots \\\\ a_{m1} & a_{m2} & \\cdots & a_{mn} \\end{pmatrix}$

特殊的矩阵

行矩阵

只有一行的矩阵(1×n矩阵)。例如 [1 2 3],写为:(a_{11}\\quad a_{12}\\quad \\cdots\\quad a_{1n})

列矩阵

只有一列的矩阵(m×1 矩阵)。例如 \\begin{bmatrix} 1 \\\\ 2 \\\\ 3 \\end{bmatrix},写为:\\begin{pmatrix} a_{11} \\\\ a_{21} \\\\ \\vdots \\\\ a_{m1} \\end{pmatrix}

方阵

当m=n时,即矩阵的行数与列数相同时,称矩阵为方阵。

主对角线

只有方阵才有主对角线 。从矩阵左上角到右下角,由所有行下标 = 列下标的元素组成的对角线。

A_{n \\times n} = \\begin{pmatrix} a_{11} & a_{12} & \\cdots & a_{1n} \\\\ a_{21} & a_{22} & \\cdots & a_{2n} \\\\ \\vdots & \\vdots & \\ddots & \\vdots \\\\ a_{n1} & a_{n2} & \\cdots & a_{nn} \\end{pmatrix}

斜对角线

从矩阵的右上角(第 1 行第 n 列)延伸到左下角(第 n 行第 1 列)。斜对角线上的元素位置满足:行下标 + 列下标 = n + 1。即:a_{i,n+1-i} \\quad (i = 1, 2, \\dots, n)

$A_{n \\times n} = \\begin{pmatrix} a_{11} & a_{12} & \\cdots & a_{1(n-1)} & a_{1n} \\\\ a_{21} & a_{22} & \\cdots & a_{2(n-1)} & a_{2n} \\\\ \\vdots & \\vdots & \\ddots & \\vdots & \\vdots \\\\ a_{(n-1)1} & a_{(n-1)2} & \\cdots & a_{(n-1)(n-1)} & a_{(n-1)n} \\\\ a_{n1} & a_{n2} & \\cdots & a_{n(n-1)} & a_{nn} \\end{pmatrix}$

单位阵

它的主对角线上的元素全为 1,其余所有元素全为 0,就得到又一个特殊的矩阵叫做单位阵,,记为 E_n 或 L_n

单位阵性质

对任意可乘矩阵 A,则有:$A E_n = A,\\quad E_m A = A$

转置不变:$E_n^T = E_n$

幂等性:$E_n^k = E_n$  (任意正整数 k)  

数量阵

它的主对角线上的元素全为 k,其余所有元素全为 0,就得到又一个特殊的矩阵叫做数量阵

上三角矩阵

主对角线以下的元素全为零的方阵,对于一个矩阵 U,如果当 i>j(即行号大于列号,也就是主对角线以下的元素)时,有u_{ij} = 0,那么 U就是一个上三角矩阵。

下三角矩阵

对于一个矩阵 L,如果当 i<j(即行号小于列号,也就是主对角线以上的元素)时,有 l_{ij} = 0,那么 LL就是一个下三角矩阵

零矩阵

所有元素都是0的矩阵,零矩阵用大写的O表示。

$O_{m \\times n} = \\begin{pmatrix} 0 & \\cdots & 0 \\\\ \\vdots & \\ddots & \\vdots \\\\ 0 & \\cdots & 0 \\end{pmatrix}$

梯形阵

A = (a_{ij})_{m \\times n}为非零矩阵,若非零行(即至少有一个非零元素的行)全在零行的上面,A中各非零行中第一个(最后一个)非零元素前(后)面零元素的个数随行数增大而增多(减少),则称为上(下)梯形矩阵。简称为上(下)梯形阵。

矩阵的运算

矩阵相等

两个矩阵 A 和 B 称为相等,记作 A = B,当且仅当它们满足以下两个条件:

维度相同:矩阵 A 和 B 必须有相同的行数和相同的列数(即同为 m×n 矩阵)。

对应元素相等:对于所有的 i 和 j (1≤i≤m,1≤j≤n),矩阵 A 的第 i 行第 j 列的元素a_{ij}等于矩阵 B 的第 i 行第 j 列的元素 b_{ij}

换句话说,两个矩阵相等意味着它们作为数学对象是完全一样的,没有任何区别。

矩阵加法

设 A=(a_{ij}) 和 B=(a_{ij})是两个 m×n 矩阵(即行数、列数相同)。它们的和 A+B 是一个 m×n 矩阵 C=(a_{ij}),其中 C 的每个元素等于 A 和 B 对应位置元素之和:

c_{ij} = a_{ij} + b_{ij} \\quad (1 \\leq i \\leq m,\\ 1 \\leq j \\leq n).

例如\\mathbf{A} = \\begin{bmatrix} 1 & 2 \\\\ 3 & 4 \\end{bmatrix}, \\quad \\mathbf{B} = \\begin{bmatrix} 5 & 6 \\\\ 7 & 8 \\end{bmatrix}.

结果为:\\mathbf{A} + \\mathbf{B} = \\begin{bmatrix} 1 + 5 & 2 + 6 \\\\ 3 + 7 & 4 + 8 \\end{bmatrix} = \\begin{bmatrix} 6 & 8 \\\\ 10 & 12 \\end{bmatrix}

注意

  • 只有同型矩阵才能相加。如果两个矩阵的行数或列数不同,则它们的和没有定义。

  • 加法运算可以推广到多个矩阵相加,只要它们都是同型的。

性质

  • 交换律:A+B=B+A。

  • 结合律:(A+B)+C=A+(B+C)。

  • 存在零矩阵:存在一个 m×n 的零矩阵 0(所有元素为零),使得 A+0=A。

  • 存在负矩阵:对于每个矩阵 A,存在唯一的矩阵 −A(称为 A 的负矩阵),其元素是 A 对应元素的相反数,满足 A+(−A)=0。

  • 矩阵减法

    利用负矩阵,可以定义矩阵减法:\\mathbf{A} - \\mathbf{B} = \\mathbf{A} + (-\\mathbf{B})

    矩阵乘法

    矩阵乘法是线性代数中最核心的操作之一,但它的计算规则和意义可能与大家熟悉的数的乘法有很大不同。矩阵乘法并不是两个同维数的矩阵对应元素相乘。我们通常说的矩阵乘法是指一般矩阵乘积(也称为点积或内积相乘)。

    可乘性

    • 并不是任意两个矩阵都能相乘。

    • 设矩阵 A 的尺寸为 m×n(m 行 n 列),矩阵 B 的尺寸为 p×q。只有当 A 的列数等于 B 的行数时,即 n=p,A 和 B 才能相乘。

    计算规则:“左行乘右列”

    假设我们计算 C=A×B,结果矩阵 C 的尺寸是 m×q(A 的行数,B 的列数)。如何求 C中第 i 行第 j 列的元素c_{ij}。例如我有两个矩阵A和B相乘,那么结果如下:

    A_{m\\times s}B_{s\\times n} = C_{m\\times n}

    取 A 的第 i 行的每一个元素,取 B 的第 j 列的每一个元素,将它们对应相乘,然后求和。如果换成公式就是:$c_{ij} = a_{i1}b_{1j} + a_{i2}b_{2j} + \\dots + a_{is}b_{sj} = \\sum_{k=1}^s a_{ik}b_{kj}$,其中 n 是 A 的列数(也是 B 的行数) 。

    设矩阵 A 和 B 如下:A = \\begin{bmatrix} 1 & 2 \\\\ 3 & 4 \\end{bmatrix}, \\quad B = \\begin{bmatrix} 5 & 6 \\\\ 7 & 8 \\end{bmatrix}

    计算 C=A×B:

    • 第一行第一列:C_{11}=1×5+2×7=5+14=19

    • 第一行第二列:C_{12}=1×6+2×8=6+16=22

    • 第二行第一列:C_{21}=3×5+4×7=15+28=43

    • 第二行第二列:C_{22}=3×6+4×8=18+32=50

    结果为:C = \\begin{bmatrix} 19 & 22 \\\\ 43 & 50 \\end{bmatrix}

     重要性质(与数的乘法不同)

    矩阵乘法有很多违反直觉的性质,这是初学者容易出错的地方。

    • 不满足交换律:通常 A×B = B×A。有时 AXB 有意义,但 BXA可能根本不能乘(因为维度对不上)。即使都能乘,结果也往往不同。如下所示

    • 不满足数乘法定律:例如 AB=AC,但是B和C不一定相等。如下所示

    • 满足结合律:(AB)C=A(BC),前提是维度允许。
    • 满足分配律:A(B+C)=AB+AC。

    • 零因子存在:两个非零矩阵相乘,结果可能是零矩阵,如下所示

      \\begin{bmatrix} 1 & 1 \\\\ 1 & 1 \\end{bmatrix} \\times \\begin{bmatrix} 1 & 1 \\\\ -1 & -1 \\end{bmatrix} = \\begin{bmatrix} 0 & 0 \\\\ 0 & 0 \\end{bmatrix}

    方阵的幂

    只有方阵才能算幂,设 A 是 n 阶方阵,k 是正整数则有A^k = \\underbrace{A\\cdot A\\cdot \\dots \\cdot A}_{k\\text{}}

    定律

    A^k A^l = A^{k+l},\\quad (A^k)^l = A^{kl}

    一般来说  $(AB)^k \\neq A^k B^k$,因为矩阵乘法不满足交换律。但如果 AB=BA,等式成立。

    转置:$(A^k)^T = (A^T)^k$

    转置矩阵

    将一个 m×n 的矩阵 A 的行和列互换,得到的 n×m 的新矩阵称为 A 的转置矩阵,记作 A^T(或 A′)。

    元素关系:如果 B = A^T,那么 B 中第 i 行第 j 列的元素等于 A 中第 j 行第 i 列的元素。 即(A^T)_{ij} = A_{ji}

    基本性质

    双重转置等于原矩阵:(A^T)^T = A

    和的转置等于转置的和:(A + B)^T = A^T + B^T

    数乘的转置:(kA)^T = kA^T

    乘积的转置(反转顺序):(AB)^T = B^T A^T

            推导一下(AB)^T = B^T A^T,设 A = (a_{ij})_{m \\times s},根据矩阵的可乘性质那么B = (b_{ij})_{s \\times n},所以矩阵A和B的转置矩阵为:A^T = (a_{ji})_{s \\times m} \\quad B^T = (b_{ji})_{n \\times s},那么就有C = AB = (c_{ij})_{m \\times n} \\quad B^T A^T = (d_{ij})_{n \\times m},我们可以发现矩阵C的转置就是nxm,和B^TA^T的nxm相同。然后只要明证矩阵的对应元素相同即可,即证明C_{ji}=d_{ij}即可,因为c_{ji} = a_{j1}b_{1i} + a_{j2}b_{2i} + \\dots + a_{js}b_{si}d_{ij} = b_{1i}a_{j1} + b_{2i}a_{j2} + \\dots + b_{st}a_{js},所以对应元素也会相同。

    对称矩阵

    如果一个矩阵,它的转置和它本身相等,我们就把这个矩阵叫做对称阵。所以对阵矩阵一定是方阵。即:A^T = A,对于矩阵元素有:a_{ij} = a_{ji}

    对称矩阵意味着,以主对角线为轴,两边元素完全一样。所以对称矩阵的和、数乘仍然对称。

     ======================================

    喜欢请点赞收藏加关注~~~      好文分享不迷路~~~

    =======================================

    赞(0)
    未经允许不得转载:网硕互联帮助中心 » 【线性代数】矩阵第一讲:矩阵与矩阵的运算
    分享到: 更多 (0)

    评论 抢沙发

    评论前必须登录!