天天看點

矩陣乘法的簡單了解

目錄:

      • 一、從定義的角度進行解釋
      • 二、從行(列)向量組的角度進行解釋
        • 1. 行向量組
        • 2.列向量組
      • 三、複合線性映射

初識矩陣的乘法,就跟很多人一樣,将定義機械地記憶下來:

  兩個矩陣相乘,要求前一個矩陣的列數和後一個矩陣的行數相等. 乘積矩陣的第 i i i 行第 j j j 列的元素等于前一個矩陣的第 i i i 個行向量與後一個矩陣的第 j j j 個列向量的内積(或點乘),用數學符号來描述就是:

假設有兩個矩陣 A = ( a i j ) m × n ,   B = ( b i j ) n × s A=(a_{ij})_{m\times n},\, B=(b_{ij})_{n\times s} A=(aij​)m×n​,B=(bij​)n×s​則

C = A B = ( c i j ) m × s C=AB=(c_{ij})_{m\times s} C=AB=(cij​)m×s​ c i j = ∑ k = 1 n a i k b k j c_{ij}=\sum_{k=1}^{n}a_{ik}b_{kj} cij​=k=1∑n​aik​bkj​

但矩陣乘法究竟該如何了解?下面給出我的答案:

一、從定義的角度進行解釋

最符合直覺的一種方式,即與定義最為接近的一種了解方式:

對 A \small A A 進行行分塊:

A = ( α 1 T α 2 T ⋮ α m T ) A= \begin{pmatrix} \alpha_1^T \\ \alpha_2^T \\ \vdots \\ \alpha_m^T \\ \end{pmatrix} A=⎝⎜⎜⎜⎛​α1T​α2T​⋮αmT​​⎠⎟⎟⎟⎞​對 B \small B B 進行列分塊:

B = ( β 1    β 2    ⋯    β s ) B=\begin{pmatrix} \beta_1 \; \beta_2 \; \cdots \; \beta_s \\ \end{pmatrix} B=(β1​β2​⋯βs​​)則

C = ( α 1 T α 2 T ⋮ α m T ) ( β 1   β 2   ⋯   β s ) = ( α 1 T β 1 α 1 T β 2 ⋯ α 1 T β s α 2 T β 1 α 2 T β 2 ⋯ α 2 T β s ⋮ ⋮ ⋱ ⋮ α m T β 1 α m T β 2 ⋯ α m T β s ) C=\begin{pmatrix}\alpha_1^T \\ \alpha_2^T\\ \vdots \\ \alpha_m^T\end{pmatrix}(\beta_1\,\beta_2\,\cdots\,\beta_s)=\begin{pmatrix} \alpha_1^T\beta_1 & \alpha_1^T\beta_2 & \cdots & \alpha_1^T\beta_s \\ \alpha_2^T\beta_1 & \alpha_2^T\beta_2 & \cdots & \alpha_2^T\beta_s \\ \vdots & \vdots & \ddots & \vdots \\ \alpha_m^T\beta_1 & \alpha_m^T\beta_2 & \cdots & \alpha_m^T\beta_s \\ \end{pmatrix} C=⎝⎜⎜⎜⎛​α1T​α2T​⋮αmT​​⎠⎟⎟⎟⎞​(β1​β2​⋯βs​)=⎝⎜⎜⎜⎛​α1T​β1​α2T​β1​⋮αmT​β1​​α1T​β2​α2T​β2​⋮αmT​β2​​⋯⋯⋱⋯​α1T​βs​α2T​βs​⋮αmT​βs​​⎠⎟⎟⎟⎞​乘積矩陣 C \small C C 中的每個元素都是對應行向量與列向量的點乘.

現在逆向思維,将思路反過來.

已知向量 α = ( a 1   a 2   ⋯   a n ) T , β = ( b 1   b 2   ⋯   b n ) T \alpha=(a_1\,a_2\,\cdots\,a_n)^T,\beta=(b_1\,b_2\,\cdots\,b_n)^T α=(a1​a2​⋯an​)T,β=(b1​b2​⋯bn​)T,則兩者的點積為 ( α , β ) = ∑ i = 1 n a i b i (\alpha,\beta)=\sum_{i=1}^n a_ib_i (α,β)=i=1∑n​ai​bi​可以寫作 ( α , β ) = ( a 1   a 2   ⋯   a n ) ( b 1 b 2 ⋮ b n ) = α T β (\alpha,\beta)=(a_1\,a_2\,\cdots\,a_n)\begin{pmatrix}b_1 \\ b_2 \\ \vdots \\ b_n\end{pmatrix}=\alpha^T\beta (α,β)=(a1​a2​⋯an​)⎝⎜⎜⎜⎛​b1​b2​⋮bn​​⎠⎟⎟⎟⎞​=αTβ現在假設有一組向量 β 1 , β 2 , ⋯   , β s \beta_1,\beta_2,\cdots,\beta_s β1​,β2​,⋯,βs​,按照這種排列構成一個矩陣 B = ( β 1   β 2   ⋯   β s ) \small B=(\beta_1\,\beta_2\,\cdots\,\beta_s) B=(β1​β2​⋯βs​),則可以定義 α T \alpha^T αT 與矩陣 B \small B B 的乘法如下: α T B = α T ( β 1   β 2   ⋯   β s ) = ( α T β 1   α T β 2   ⋯   α T β s ) \alpha^T B=\alpha^T(\beta_1\,\beta_2\,\cdots\,\beta_s)=(\alpha^T\beta_1\,\alpha^T\beta_2\,\cdots\,\alpha^T\beta_s) αTB=αT(β1​β2​⋯βs​)=(αTβ1​αTβ2​⋯αTβs​)再假設有一組向量 α 1 , α 2 , ⋯   , α m \alpha_1,\alpha_2,\cdots,\alpha_m α1​,α2​,⋯,αm​,則其與 B \small B B 的乘積定義如下:

令 A = ( α 1 T α 2 T ⋮ α m T ) A=\begin{pmatrix}\alpha_1^T \\ \alpha_2^T \\ \vdots \\ \alpha_m^T\end{pmatrix} A=⎝⎜⎜⎜⎛​α1T​α2T​⋮αmT​​⎠⎟⎟⎟⎞​則 A B = ( α 1 T α 2 T ⋮ α m T ) ( β 1   β 2   ⋯   β s ) = ( α 1 T β 1 α 1 T β 2 ⋯ α 1 T β s α 2 T β 1 α 2 T β 2 ⋯ α 2 T β s ⋮ ⋮ ⋱ ⋮ α m T β 1 α m T β 2 ⋯ α m T β s ) AB=\begin{pmatrix}\alpha_1^T \\ \alpha_2^T \\ \vdots \\ \alpha_m^T\end{pmatrix}(\beta_1\,\beta_2\,\cdots\,\beta_s)=\begin{pmatrix} \alpha_1^T\beta_1 & \alpha_1^T\beta_2 & \cdots & \alpha_1^T\beta_s \\ \alpha_2^T\beta_1 & \alpha_2^T\beta_2 & \cdots & \alpha_2^T\beta_s \\ \vdots & \vdots & \ddots & \vdots \\ \alpha_m^T\beta_1 & \alpha_m^T\beta_2 & \cdots & \alpha_m^T\beta_s \\ \end{pmatrix} AB=⎝⎜⎜⎜⎛​α1T​α2T​⋮αmT​​⎠⎟⎟⎟⎞​(β1​β2​⋯βs​)=⎝⎜⎜⎜⎛​α1T​β1​α2T​β1​⋮αmT​β1​​α1T​β2​α2T​β2​⋮αmT​β2​​⋯⋯⋱⋯​α1T​βs​α2T​βs​⋮αmT​βs​​⎠⎟⎟⎟⎞​

二、從行(列)向量組的角度進行解釋

1. 行向量組

對 B \small B B 進行行分塊: B = ( β 1 T β 2 T ⋮ β n T ) B=\begin{pmatrix} \beta_1^T \\ \beta_2^T \\ \vdots \\ \beta_n^T \\ \end{pmatrix} B=⎝⎜⎜⎜⎛​β1T​β2T​⋮βnT​​⎠⎟⎟⎟⎞​ A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix} A=⎝⎜⎜⎜⎛​a11​a21​⋮am1​​a12​a22​⋮am2​​⋯⋯⋱⋯​a1n​a2n​⋮amn​​⎠⎟⎟⎟⎞​則

C = A B = ( a 11 β 1 T + a 12 β 2 T + ⋯ + a 1 n β n T a 21 β 1 T + a 22 β 2 T + ⋯ + a 2 n β n T ⋯ a m 1 β 1 T + a m 2 β 2 T + ⋯ + a m n β n T ) C=AB=\begin{pmatrix} a_{11}\beta_1^T+a_{12}\beta_2^T+\cdots+a_{1n}\beta_n^T \\ a_{21}\beta_1^T+a_{22}\beta_2^T+\cdots+a_{2n}\beta_n^T \\ \cdots \\ a_{m1}\beta_1^T+a_{m2}\beta_2^T+\cdots+a_{mn}\beta_n^T \end{pmatrix} C=AB=⎝⎜⎜⎛​a11​β1T​+a12​β2T​+⋯+a1n​βnT​a21​β1T​+a22​β2T​+⋯+a2n​βnT​⋯am1​β1T​+am2​β2T​+⋯+amn​βnT​​⎠⎟⎟⎞​

即乘積矩陣 C \small C C 的每個行向量都是矩陣 B \small B B 行向量組的線性組合,第 i i i 個行向量的組合系數是矩陣 A \small A A 的第 i i i 行, i = 1 , 2 , ⋯   , m i=1,2,\cdots,m i=1,2,⋯,m.

是以,左乘一個矩陣就相當于對原矩陣進行了行變換.

2.列向量組

對 A \small A A 進行列分塊: A = ( α 1   α 2   ⋯   α n ) A=\begin{pmatrix}\alpha_1 \, \alpha_2 \, \cdots \, \alpha_n \end{pmatrix} A=(α1​α2​⋯αn​​) B = ( b 11 b 12 ⋯ b 1 s b 21 b 22 ⋯ b 2 s ⋮ ⋮ ⋱ ⋮ b n 1 b n 2 ⋯ b n s ) B=\begin{pmatrix} b_{11} & b_{12} & \cdots & b_{1s} \\ b_{21} & b_{22} & \cdots & b_{2s} \\ \vdots & \vdots & \ddots & \vdots \\ b_{n1} & b_{n2} & \cdots & b_{ns} \\ \end{pmatrix} B=⎝⎜⎜⎜⎛​b11​b21​⋮bn1​​b12​b22​⋮bn2​​⋯⋯⋱⋯​b1s​b2s​⋮bns​​⎠⎟⎟⎟⎞​則

C = A B = ( b 11 α 1 + b 21 α 2 + ⋯ + b n 1 α n    b 12 α 1 + b 22 α 2 + ⋯ + b n 2 α n    ⋯    b 1 s α 1 + b 2 s α 2 + ⋯ + b n s α n ) C=AB=\\(b_{11}\alpha_1+b_{21}\alpha_2+\cdots+b_{n1}\alpha_n\,\,b_{12}\alpha_1+b_{22}\alpha_2+\cdots+b_{n2}\alpha_n \,\, \cdots \,\, b_{1s}\alpha_1+b_{2s}\alpha_2+\cdots+b_{ns}\alpha_n ) C=AB=(b11​α1​+b21​α2​+⋯+bn1​αn​b12​α1​+b22​α2​+⋯+bn2​αn​⋯b1s​α1​+b2s​α2​+⋯+bns​αn​)

即乘積矩陣 C \small C C 的每個列向量都是矩陣 A \small A A 列向量組的線性組合,第 j j j 個列向量的組合系數是矩陣 B \small B B 的第 j j j 列, j = 1 , 2 , ⋯   , s j=1,2,\cdots,s j=1,2,⋯,s.

右乘一個矩陣就相當于對原矩陣進行了列變換.

三、複合線性映射

  首先來說一下矩陣與線性映射的關系,用一句話來說就是,二者一一對應,即給定一個線性映射,可以唯一确定一個矩陣,反之亦然。下面進行解釋。

  設 V 1 \small V_1 V1​ 是數域 P \small P P 上的 n n n 維線性空間, ϵ 1 , ϵ 2 , ⋯   , ϵ n \epsilon_1,\epsilon_2,\cdots,\epsilon_n ϵ1​,ϵ2​,⋯,ϵn​ 為 V 1 \small V_1 V1​ 的一組基, V 2 \small V_2 V2​ 是數域 P \small P P 上的 m m m 維線性空間, η 1 , η 2 , ⋯   , η m \eta_1,\eta_2,\cdots,\eta_m η1​,η2​,⋯,ηm​ 為 V 2 \small V_2 V2​ 的一組基, A \mathscr{A} A 是 V 1 \small V_1 V1​ 到 V 2 \small V_2 V2​ 的一個線性映射. 則 A ( ϵ i ) ∈ V 2 \small \mathscr{A}(\epsilon_i)\in V_2 A(ϵi​)∈V2​,可以由 η 1 , η 2 , ⋯   , η m \eta_1,\eta_2,\cdots,\eta_m η1​,η2​,⋯,ηm​ 線性表出,設 { A ( ϵ 1 ) = a 11 η 1 + a 21 η 2 + ⋯ + a m 1 η m A ( ϵ 2 ) = a 12 η 1 + a 22 η 2 + ⋯ + a m 2 η m    ⋯   = ⋯ ⋯ A ( ϵ n ) = a 1 n η 1 + a 2 n η 2 + ⋯ + a m n η m \begin{cases} \mathscr{A}(\epsilon_1)=a_{11}\eta_1+a_{21}\eta_2+\cdots+a_{m1}\eta_m\\ \mathscr{A}(\epsilon_2)=a_{12}\eta_1+a_{22}\eta_2+\cdots+a_{m2}\eta_m\\ \quad\,\,\cdots\,=\cdots\cdots\\ \mathscr{A}(\epsilon_n)=a_{1n}\eta_1+a_{2n}\eta_2+\cdots+a_{mn}\eta_m\\\end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧​A(ϵ1​)=a11​η1​+a21​η2​+⋯+am1​ηm​A(ϵ2​)=a12​η1​+a22​η2​+⋯+am2​ηm​⋯=⋯⋯A(ϵn​)=a1n​η1​+a2n​η2​+⋯+amn​ηm​​表示為矩陣形式

A ( ϵ 1 , ϵ 2 , ⋯   , ϵ n ) = ( η 1 , η 2 , ⋯   , η m ) A \mathscr{A}(\epsilon_1,\epsilon_2,\cdots,\epsilon_n)=(\eta_1,\eta_2,\cdots,\eta_m)A A(ϵ1​,ϵ2​,⋯,ϵn​)=(η1​,η2​,⋯,ηm​)A其中 A = [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ] A=\begin{bmatrix}a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n}\\\vdots & \vdots & \ddots & \vdots\\a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix} A=⎣⎢⎢⎢⎡​a11​a21​⋮am1​​a12​a22​⋮am2​​⋯⋯⋱⋯​a1n​a2n​⋮amn​​⎦⎥⎥⎥⎤​  因為 η 1 , η 2 , ⋯   , η m \eta_1,\eta_2,\cdots,\eta_m η1​,η2​,⋯,ηm​ 線性無關,是以組合系數唯一,可以由線性映射 A \small \mathscr{A} A 唯一确定矩陣 A \small A A.

  另一方面,若已知矩陣 A \small A A,可以構造如上的線性映射. ∀   α ∈ V 1 \small \forall \, \alpha\in V_1 ∀α∈V1​, α \alpha α 可以由 ϵ 1 , ϵ 2 , ⋯   , ϵ n \epsilon_1,\epsilon_2,\cdots,\epsilon_n ϵ1​,ϵ2​,⋯,ϵn​ 線性表出,設 α = k 1 ϵ 1 + k 2 ϵ 2 + ⋯ + k n ϵ n \alpha=k_1\epsilon_1+k_2\epsilon_2+\cdots+k_n\epsilon_n α=k1​ϵ1​+k2​ϵ2​+⋯+kn​ϵn​,根據映射的線性性 A ( α ) = A ( α ) = k 1 A ( ϵ 1 ) + k 2 A ( ϵ 2 ) + ⋯ + k n A ( ϵ n ) = A ( ϵ 1 , ϵ 2 , ⋯   , ϵ n ) ( k 1 k 2 ⋮ k n ) = ( η 1 , η 2 , ⋯   , η m ) A k ⃗ \begin{aligned}\mathscr{A}(\alpha)&=\mathscr{A}(\alpha)\\&=k_1\mathscr{A}(\epsilon_1)+k_2\mathscr{A}(\epsilon_2)+\cdots+k_n\mathscr{A}(\epsilon_n)\\&=\mathscr{A}(\epsilon_1,\epsilon_2,\cdots,\epsilon_n)\begin{pmatrix}k_1\\k_2\\\vdots\\k_n\end{pmatrix}\\&=(\eta_1,\eta_2,\cdots,\eta_m)A\vec{k}\end{aligned} A(α)​=A(α)=k1​A(ϵ1​)+k2​A(ϵ2​)+⋯+kn​A(ϵn​)=A(ϵ1​,ϵ2​,⋯,ϵn​)⎝⎜⎜⎜⎛​k1​k2​⋮kn​​⎠⎟⎟⎟⎞​=(η1​,η2​,⋯,ηm​)Ak ​其中 A k ⃗ \small A\vec{k} Ak 為 m m m 維列向量,即 A ( α ) \small \mathscr{A}(\alpha) A(α) 在基 η 1 , η 2 , ⋯   , η m \eta_1,\eta_2,\cdots,\eta_m η1​,η2​,⋯,ηm​ 下的坐标. 故可以根據矩陣 A \small A A 唯一确定線性映射 A \small \mathscr{A} A.

  是以,給定兩組基的情況下,矩陣與線性映射一一對應.

下面從複合線性映射的角度來了解矩陣乘法:

  增設 V 3 \small V_3 V3​ 為數域 P \small P P 上的 s s s 維線性空間, ξ 1 , ξ 2 , ⋯   , ξ s \xi_1,\xi_2,\cdots,\xi_s ξ1​,ξ2​,⋯,ξs​ 為 V 3 \small V_3 V3​ 的一組基, B \small \mathscr{B} B 為 V 2 \small V_2 V2​ 到 V 3 \small V_3 V3​ 的一個線性映射,表示成矩陣形式 B ( η 1 , η 2 , ⋯   , η m ) = ( ξ 1 , ξ 2 , ⋯   , ξ s ) B \mathscr{B}(\eta_1,\eta_2,\cdots,\eta_m)=(\xi_1,\xi_2,\cdots,\xi_s)B B(η1​,η2​,⋯,ηm​)=(ξ1​,ξ2​,⋯,ξs​)B考慮複合映射 C = B ∘ A \mathscr{C}=\mathscr{B}\circ\mathscr{A} C=B∘A,則 C \small \mathscr{C} C 為 V 1 \small V_1 V1​ 到 V 3 \small V_3 V3​ 的線性映射,表示成矩陣形式

C ( ϵ 1 , ϵ 2 , ⋯   , ϵ n ) = ( ξ 1 , ξ 2 , ⋯   , ξ s ) C \mathscr{C}(\epsilon_1,\epsilon_2,\cdots,\epsilon_n)=(\xi_1,\xi_2,\cdots,\xi_s)C C(ϵ1​,ϵ2​,⋯,ϵn​)=(ξ1​,ξ2​,⋯,ξs​)C另一方面 C ( ϵ 1 , ϵ 2 , ⋯   , ϵ n ) = B ∘ A ( ϵ 1 , ϵ 2 , ⋯   , ϵ n ) = B ( η 1 , η 2 , ⋯   , η m ) A = ( B ( η 1 , η 2 , ⋯   , η m ) ) A = ( ξ 1 , ξ 2 , ⋯   , ξ s ) B A \begin{aligned}\mathscr{C}(\epsilon_1,\epsilon_2,\cdots,\epsilon_n)&=\mathscr{B}\circ\mathscr{A}(\epsilon_1,\epsilon_2,\cdots,\epsilon_n)\\&=\mathscr{B}(\eta_1,\eta_2,\cdots,\eta_m)A\\&=\big(\mathscr{B}(\eta_1,\eta_2,\cdots,\eta_m)\big)A\\&=(\xi_1,\xi_2,\cdots,\xi_s)BA\end{aligned} C(ϵ1​,ϵ2​,⋯,ϵn​)​=B∘A(ϵ1​,ϵ2​,⋯,ϵn​)=B(η1​,η2​,⋯,ηm​)A=(B(η1​,η2​,⋯,ηm​))A=(ξ1​,ξ2​,⋯,ξs​)BA​由唯一性 C = B A C=BA C=BA

Plus: 如有錯誤、可以改進的地方、或任何想說的,請在評論區留言!

繼續閱讀