2016-01-13

Eigenvectors and Eigenvalues (vector riêng/đặc trưng và giá trị riêng/đặc trưng)

Note lại 1 số kiến thức nền về đại số tuyến tính có liên quan đến đủ mọi thứ như SVD, PCA, optimization ... (không đầy đủ, xem thêm trong các tài liệu khác).

Linear Algebra MIT OCW
Linear Algebra Done Right, by Sheldon Axler (Author), ISBN-13: 978-3319110790
...

Tiếp theo phần Vectors và Matrices

Eigenvectors and Eigenvalues (vector riêng/đặc trưng và giá trị riêng/đặc trưng)


Cho A là ma trận vuông cấp n trên trường F (F= ℝ; ℂ). Một số \(\lambda  \in F\)(scalar) được gọi là giá trị riêng (hay gọi tắt là trị riêng) của ma trận A nếu tồn tại một vector \(x \in {F^n},x \ne 0\) sao cho \(Ax = \lambda x\).
Nếu \(x = ({x_1},{x_2}, \ldots ,{x_n})\) là vector riêng của ma trận A với trị riêng \(\lambda \) thì với mọi số vô hướng \(\alpha  \ne 0\)\(\alpha x\) cũng là vector riêng của A ứng với trị riêng \(\lambda \). Tất cả các vector riêng có cùng giá trị riêng cùng vector 0, tạo thành một không gian riêng (eigenspace) ký hiệu là \({E_\lambda }\). Hay\({E_\lambda }\)là không gian nghiệm (nullspace) của phương trình \((A - \lambda I)x = 0\) (hệ phương trình tuyến tính thuần nhất). \({E_\lambda }\) là không gian con của \({F^n}\).

Tính chất:
§  \(\lambda \) chính là nghiệm của phương trình \({p_A}\left( z \right) = \det \left( {A - zI} \right) = 0\) gọi là phương trình đặc trưng của ma trận A. \({p_A}\left( z \right) = {\rm{det}}\left( {A - zI} \right)\) gọi là đa thức đặc trưng của ma trận A.
§  Một giá trị riêng có thể ứng với nhiều vector riêng (do\(x \ne 0\)nên hệ phương trình thuần nhất có một nghiệm khác 0, có nghĩa hệ có vô số nghiệm)
§  Mỗi vector riêng chỉ ứng với một giá trị riêng duy nhất
§  Ma trận A là nghiệm của đa thức đặc trưng của chính nó (trong trường hợp này đa thức đặc trưng được coi là đa thức ma trận, nghĩa là biến số của nó không phải là biến số thực mà là biến ma trận).
§  Nếu \(\lambda  = 0\) là giá trị riêng của ma trận A thì A không khả nghịch. Ngược lại, nếu mọi giá trị riêng của A đều khác không thì A khả nghịch.
§  Nếu \(\lambda \) là giá trị riêng của A thì\({\lambda ^k}\) là giá trị riêng của \({A^k}\).
Ví dụ về eigenvectors và eigenvalues:
Một biến đổi tuyến tính (linear transformation) \(T({x_1},{x_2}) = (5{x_1},15{x_2})\) có ý nghĩa hình học đơn giản dễ thấy: kéo dãn (stretch) 5 lần theo chiều \({x_1}\)(\({x_1} - direction\)) và 15 lần theo chiều \({x_2}\).



Ngược lại \(T({x_1},{x_2}) = (13{x_1}\; - {\rm{ }}4{x_2}, - {\rm{ }}4{x_1}\; + {\rm{ }}7{x_2})\) không có ý nghĩa hình học đơn giản như ví dụ trên.
Tuy nhiên bằng cách sử dụng hai vector cơ sở (basic vectors) $v_1=\left( 1,2 \right),v_2=\left( -2,1 \right)$:
$T(v_1)=\left( 13(1)-4(2),-4(1)+7(2) \right)=\left( 5,10 \right)=5v_1$$T(v_2)=\left( 13\left( -2 \right)-4(1),-4\left( -2 \right)+7(1) \right)=\left( -30,15 \right)=15v_2$
Có nghĩa phép biến đổi T có ý nghĩa hình học đơn giản là kéo dãn 5 lần theo \({v_1} - direction\) và 15 lần theo \({v_2} - direction\). Có thể thấy $v_1=\left( 1,2 \right),v_2=\left( -2,1 \right)$ chính là các eigenvectors của T tương ứng với các eigenvalues là \({\lambda _1} = 5,{\lambda _2} = 15\) (WolframAlpha “eigenvectors {{13,-4},{-4,7}}”)

Characteristic Polynomial (đa thức đặc trưng)


Đa thức bậc n của biến z gọi là đa thức đặc trưng của ma trận A là đa thức ký hiệu \({p_A}\left( z \right)\) hay \({P_A}\left( z \right)\) được định nghĩa như sau: \({p_A}\left( z \right) = {\rm{det}}\left( {A - zI} \right)\).

§  Các nghiệm của đa thức đặc trưng gọi là giá trị riêng của ma trận A

§  Nếu \(\lambda \) là một giá trị riêng của A thì \(det(A - \lambda I) = 0\) do đó hệ phương trình thuần nhất
\(\left( {A - \lambda I} \right)\left[ {\begin{array}{*{20}{c}}{{x_1}}\\ \vdots \\{{x_n}}\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}0\\ \vdots \\0\end{array}} \right]\)
 có vô số nghiệm. Không gian nghiệm của phương trình trên gọi là không gian con riêng của ma trận A ứng với giá trị riêng \(\lambda \). Các vector khác không là nghiệm của phương trình trên gọi là các vector riêng của ma trận A ứng với giá trị riêng \(\lambda \), tạo thành một cơ sở của không gian riêng gọi là các vector riêng độc lập tuyến tính với giá trị riêng \(\lambda \).

Định lý:
Vô hướng \(\lambda \) là giá trị riêng của A khi và chỉ khi \({p_A}\left( \lambda  \right) = 0\)
Chứng minh:

Số \(\lambda \) là giá trị riêng của A khi và chỉ khi tồn tại một vector \(x \in {F^n},x \ne 0\) sao cho \(Ax = \lambda x\). Khi đó hệ phương trình tuyến tính \((A - \lambda I)x = 0\) có nghiệm \(x \ne 0\) hay tương đương hệ phương trình có vô số nghiệm \( \Leftrightarrow det(A - \lambda I) = 0\).

Ví dụ: tìm đa thức đặc trưng, vector riêng và giá trị riêng của ma trận
\(A = \left[ {\begin{array}{*{20}{c}}0\\1\\1\end{array}\begin{array}{*{20}{c}}1\\0\\1\end{array}\begin{array}{*{20}{c}}1\\1\\0\end{array}} \right]\)
Đa thức đặc trưng của ma trận A \({p_A}(\lambda ) = \left[ {\begin{array}{*{20}{c}}{ - \lambda }\\1\\1\end{array}\begin{array}{*{20}{c}}1\\{ - \lambda }\\1\end{array}\begin{array}{*{20}{c}}1\\1\\{ - \lambda }\end{array}} \right] =  - {\lambda ^3} + 3\lambda  + 2\)

${{p}_{A}}(\lambda )=0\Leftrightarrow {{(\lambda +1)}^{2}}(2-\lambda )=0\Leftrightarrow \lambda =-1\vee \lambda =2$
Ma trận A có hai giá trị riêng là \(\lambda  =  - 1\) và \(\lambda  = 2\)
Tìm trị vector riêng của A

§  Với \(\lambda  =  - 1\) hệ \(\left[ {\begin{array}{*{20}{c}}1\\1\\1\end{array}\begin{array}{*{20}{c}}1\\1\\1\end{array}\begin{array}{*{20}{c}}1\\1\\1\end{array}\left| {\begin{array}{*{20}{c}}0\\0\\0\end{array}} \right.} \right]\) có vô số nghiệm phụ thuộc hai tham số \({x_2},{x_3}\).

Nghiệm tổng quát là
\({x_1} =  - a - b,{x_2} = a,{x_3} = b\). Không gian con riêng của A ứng với giá trị riêng \(\lambda  =  - 1\) là \({E_{ - 1}} = \{ ( - a - b,a,b)|a,b \in R\} \) là tất cả các vector có dạng \(( - a - b,a,b)\) với \({a^2} + {b^2} \ne 0\) (vì vector riêng phải khác 0). Như vậy \(\dim E( - 1) = 2\) và A có 2 vector riêng độc lập tuyến tính ứng với giá trị riêng \(\lambda  =  - 1\) là \({\alpha _1} = ( - 1,1,0),{\alpha _2} = ( - 1,0,1)\)

§  Với \(\lambda  = 2\) hệ \(\left[ {\begin{array}{*{20}{c}}{ - 2}\\1\\1\end{array}\begin{array}{*{20}{c}}1\\{ - 2}\\1\end{array}\begin{array}{*{20}{c}}1\\1\\{ - 2}\end{array}\left| {\begin{array}{*{20}{c}}0\\0\\0\end{array}} \right.} \right]\mathop  \to \limits^{(1) \mathbin{\lower.3ex\hbox{$\buildrel\textstyle\rightarrow\over{\smash{\leftarrow}\vphantom{_{\vbox to.5ex{\vss}}}}$}} (3)} \left[ {\begin{array}{*{20}{c}}1\\1\\{ - 2}\end{array}\begin{array}{*{20}{c}}1\\{ - 2}\\1\end{array}\begin{array}{*{20}{c}}{ - 2}\\1\\1\end{array}\left| {\begin{array}{*{20}{c}}0\\0\\0\end{array}} \right.} \right]\mathop  \to \limits^{\scriptstyle(2) = (2) - 1\atop\scriptstyle(3) = (3) + 2*(2)} \left[ {\begin{array}{*{20}{c}}1\\0\\0\end{array}\begin{array}{*{20}{c}}1\\{ - 3}\\{ - 3}\end{array}\begin{array}{*{20}{c}}{ - 2}\\3\\3\end{array}\left| {\begin{array}{*{20}{c}}0\\0\\0\end{array}} \right.} \right] \to \left[ {\begin{array}{*{20}{c}}1\\0\\0\end{array}\begin{array}{*{20}{c}}1\\{ - 3}\\0\end{array}\begin{array}{*{20}{c}}{ - 2}\\3\\0\end{array}\left| {\begin{array}{*{20}{c}}0\\0\\0\end{array}} \right.} \right]\) có vô số nghiệm phụ thuộc tham số \({x_3}\). Nghiệm tổng quát là \({x_1} = a,{x_2} = a,{x_3} = a\). Không gian con riêng của A ứng với giá trị riêng \(\lambda  = 2\) là \({E_2} = \{ (a,a,a)|a \in R\} \) là tất cả các vector có dạng \((a,a,a)\) với \(a \ne 0\) (vì vector riêng phải khác 0). Như vậy \(\dim E(2) = 1\)và A có 1 vector riêng độc lập tuyến tính ứng với giá trị riêng \(\lambda  = 2\) là \({\alpha _3} = (1,1,1)\).

§  Với cả hai trường hợp A có 3 vector riêng độc lập tuyến tính là \({\alpha _1} = ( - 1,1,0),{\alpha _2} = ( - 1,0,1),{\alpha _3} = (1,1,1)\)

Do \({p_A}\left( z \right)\)là đa thức nên theo Định lý cơ bản của đại số (Fundamental theorem of algebra) mọi đa thức một biến có số nghiệm phức bằng bậc của nó, nếu mỗi nghiệm được tính với số bội của nó. Khi đó
\({p_A}\left( z \right) = (z - {\lambda _1})(z - {\lambda _2})...(z - {\lambda _n})\)
với  \({\lambda _i} \in C\) (trường số phức). Như vậy ma trận A trên trường số thực có thể có giá trị riêng ảo.

Algebraic Multiplicity (Vô số/hệ số đại số)


Nếu giá trị riêng \({\lambda _i}\) xuất hiện k lần trong biểu diễn đa thức \({p_A}\left( z \right)\) trên thì gọi \({\lambda _i}\) là giá trị riêng bội k của A. Với k = 1 thì \({\lambda _i}\) gọi là giá trị riêng đơn. Khi đó số lần lặp lại k của giá trị riêng \({\lambda _i}\) được gọi là vô số/hệ số đại số (algebraic multiplicity) của \({\lambda _i}\) ký hiệu là \(AM({\lambda _i})\) hay \({\mu _A}({\lambda _i})\).
Hệ số đại số của giá trị riêng luôn lớn hơn hay bằng hệ số hình học hay $dimE({{\lambda }_{i}})\le k$.

§  Nếu \({\mu _A}({\lambda _i}) = 1\) khi đó\({\lambda _i}\) gọi là giá trị riêng đơn (simple eigenvalue).

§  Nếu \({\mu _A}({\lambda _i}) = {\gamma _A}({\lambda _i})\)khi đó \({\lambda _i}\) gọi là semisimple eigenvalue (xem Geometric Multiplicity)

Geometric Multiplicity (Vô số/hệ số hình học)


Số chiều của không gian riêng \({E_\lambda }\) tương ứng $dimE(\lambda )$ hay chính là số vector riêng độc lập tuyến tính ứng với  giá trị riêng \({\lambda _i}\) gọi là vô số/hệ số hình học (geometric multiplicity) của \({\lambda _i}\) ký hiệu là \(GM({\lambda _i})\) hay \({\gamma _A}({\lambda _i})\). Nếu \(\lambda \) và \(\lambda \prime \) là hai giá trị riêng khác nhau thì \({E_\lambda } \cap {E_{\lambda \prime }} = \{ 0\} \).

Similarity Transformation (biến đổi đồng dạng/tương đương)


Hai ma trận vuông A và B cấp n gọi là đồng dạng với nhau ký hiệu $A \sim B$ nếu tồn tại một ma trận không suy biến (khả nghịch) P sao cho \(B = {P^{ - 1}}AP\). Quan hệ đồng dạng là một quan hệ tương đương.
Ma trận A và B gọi là unitarily similar (có khi còn gọi là unitarily equivalent) nếu $B={{U}^{*}}AU$ với U là unitary.
Ma trận P đại diện cho phép biến đổi ma trận gốc A. Phép biến đổi \(A \mapsto {P^{ - 1}}AP\)gọi là phép biến đổi đồng dạng/tương đương hay sự kết hợp/liên hợp (conjugation) của ma trận A, B gọi là ma trận liên hợp (conjugate matrix) của ma trận A. Hai ma trận đồng dạng (tương đương) có nhiều tính chất:

§  ${{p}_{A}}\left( \lambda \right)={{p}_{B}}\left( \lambda \right)$

§  Cùng trị riêng, các trị riêng có cùng vô số hình học, vô số đại số

§  $det(A)=det(B)$, $rank(A) = rank(B)$, $tr(A) = tr(B)$…

Ví dụ:
Cho\(B = {P^{ - 1}}AP\) là ma trận đồng dạng với ma trận A.
\(det(B - \lambda {I_n}) = det({P^{ - 1}}AP - \lambda {I_n}) = \det ({P^{ - 1}}AP - \lambda {P^{ - 1}}{I_n}P)\)
\( = \det ({P^{ - 1}}(A - \lambda {I_n})P) = \det ({P^{ - 1}})\det (A - \lambda {I_n})\det (P) = \det (A - \lambda {I_n})\)

Eigenvalue Decomposition (phân tích giá trị riêng)


Cho \({\lambda _1},{\lambda _2},...,{\lambda _n}\) là các giá trị riêng của ma trận A và \({x_1},{x_2},...,{x_n}\) là các vector riêng tương ứng. Gọi \({\Lambda _{nxn}}\) là ma trận chéo n×n được tạo thành bởi \({\lambda _j}\) và X là ma trận cột được tạo thành từ các vector riêng (cột thứ j của X là vector \({x_j}\) viết ở dạng cột). Khi đó do \(A{x_j} = \lambda {x_j}\):


$\left[ A \right]=\left[ {{x}_{1}}\left| {{x}_{2}}\left| ... \right.\left| {{x}_{n}} \right. \right. \right]=\left[ {{x}_{1}}\left| {{x}_{2}}\left| ... \right.\left| {{x}_{n}} \right. \right. \right]\left[ \begin{matrix}
{{\lambda }_{1}} & {} & {} \\
{} & \ddots & {} \\
{} & {} & {{\lambda }_{n}} \\ \end{matrix} \right]$

\(AX = X\Lambda \)

Giả định A có n vector độc lập tuyến tính với nhau, thì X khả nghịch tồn tại \({X^{ - 1}}\) và:
\(A = X\Lambda {X^{ - 1}}\)
Cách viết này được gọi là phân tích giá trị riêng (eigenvalue decomposition) của ma trận A.

Diagonalizability (khả năng chéo hóa được)


Cho A là ma trận vuông cấp n, ma trận A chéo hóa được nếu tồn tại một ma trận P là ma trận vuông cấp n không suy biến (khả nghịch) sao cho \(B = {P^{ - 1}}AP\) là ma trận chéo (lưu ý lúc này \(A = PB{P^{ - 1}}\)).

Chéo hóa ma trận A là tìm ma trận P vuông cấp n sao cho \(B = {P^{ - 1}}AP\) là ma trận chéo.
Nếu chéo hóa được ma trận A thì việc thao tác/nghiên cứu các tính chất trên A có thể đưa về việc thao tác/nghiên cứu các tính chất trên một ma trận chéo dễ dàng hơn.
Định lý: (điều kiện cần và đủ để một ma trận vuông chéo hóa được)

Ma trận A vuông cấp n chéo hóa được khi và chỉ khi A có đủ n vector riêng độc lập tuyến tính và \(\sum\limits_{i = 1}^k {{\rm{dimE}}({\lambda _i})}  = n\) trong đó \({\lambda _i}\) là tất cả các giá trị riêng của A.
Nếu ma trận A vuông cấp n có n trị riêng phân biệt (distinct eigenvalues) trong trường F thì sẽ chéo hóa được trên trường F (không có chiều ngược lại). Có n trị riêng phân biệt tương đương mọi giá trị riêng của A đều có vô số/hệ số đại số bằng vô số/hệ số hình học.
Lưu ý: ma trận đơn vị \(A = diag(1,1)\) đã là ma trận chéo chỉ có eigenvalue \(\lambda  = 1\) ứng với hai eigenvectors \({v_1} = (0,1),{v_2} = (1,0)\).

Nếu A chéo hóa được thì ma trận P cần tìm là ma trận cột có các cột là các vector riêng độc lập tuyến tính của A viết theo cột.

Ví dụ:
\(A = \left[ {\begin{array}{*{20}{c}}0\\1\\1\end{array}\begin{array}{*{20}{c}}1\\0\\1\end{array}\begin{array}{*{20}{c}}1\\1\\0\end{array}} \right]\)có 2 giá trị riêng \({\lambda _1} =  - 1,{\lambda _2} = 2\) (lưu ý \({\lambda _1}\)có vô số/hệ số đại số là 2) và 3 vector riêng độc lập tuyến tính \({\alpha _1} = ( - 1,1,0),{\alpha _2} = ( - 1,0,1),{\alpha _3} = (1,1,1)\).

Ma trận P cần tìm: \(P = \left[ {{\alpha _1}\left| {{\alpha _2}} \right.\left| {{\alpha _3}} \right.} \right] = \left[ {\begin{array}{*{20}{c}}{ - 1}\\1\\0\end{array}\begin{array}{*{20}{c}}{ - 1}\\0\\1\end{array}\begin{array}{*{20}{c}}1\\1\\1\end{array}} \right]\)

Ma trận chéo\(B = {P^{ - 1}}AP = \left[ {\begin{array}{*{20}{c}}{ - 1}\\0\\0\end{array}\begin{array}{*{20}{c}}0\\{ - 1}\\0\end{array}\begin{array}{*{20}{c}}0\\0\\2\end{array}} \right]\)

Ví dụ khác ứng dụng tính lũy thừa n của ma trận \(A = \left[ {\begin{array}{*{20}{c}}1&{ - 1}\\2&4\end{array}} \right]\)

Tìm trị riêng và vector riêng của A \({p_A}(\lambda ) = 0 \Leftrightarrow (\lambda  - 2)(\lambda  - 3) = 0 \Leftrightarrow \lambda  = 2 \vee \lambda  = 3\)
Các vector riêng \({\alpha _1} = [1, - 1],{\alpha _2} = [1, - 2]\)
Ma trận làm chéo hóa P: \(P = \left[ {\begin{array}{*{20}{c}}1&1\\{ - 1}&{ - 2}\end{array}} \right]\)

${{P}^{-1}}=\left[ \begin{matrix}
2 & 1 \\
-1 & -1 \\
\end{matrix} \right]$

Chéo hóa \({P^{ - 1}}AP = \left[ {\begin{array}{*{20}{c}}2&1\\{ - 1}&{ - 1}\end{array}} \right]\left[ {\begin{array}{*{20}{c}}1&{ - 1}\\2&4\end{array}} \right]\left[ {\begin{array}{*{20}{c}}1&1\\{ - 1}&{ - 2}\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}2&0\\0&3\end{array}} \right]\)


Chứng minh được $A^n=PB^nP^{-1}$:
${{({{P}^{-1}}AP)}^{2}}=({{P}^{-1}}AP)({{P}^{-1}}AP)={{P}^{-1}}{{A}^{2}}P$
${{({{P}^{-1}}AP)}^{3}}=({{P}^{-1}}AP)({{P}^{-1}}{{A}^{2}}P)={{P}^{-1}}{{A}^{3}}P$

Do đó:
${{B}^{n}}={{({{P}^{-1}}AP)}^{n}}={{P}^{-1}}{{A}^{n}}P=\left[ \begin{matrix}
{{2}^{n}} & 0 \\
0 & {{3}^{n}} \\
\end{matrix} \right]$

${{A}^{n}}=P\left[ \begin{matrix}
{{2}^{n}} & 0 \\
0 & {{3}^{n}} \\
\end{matrix} \right]{{P}^{-1}}=\left[ \begin{matrix}
{{2}^{n+1}}-{{3}^{n}} & {{2}^{n}}-{{3}^{n}} \\
-2({{2}^{n}}-{{3}^{n}}) & -{{2}^{n}}+{{2.3}^{n}} \\ \end{matrix} \right]$

Matrix Decomposition (phân tích/triển khai ma trận)


Phân tích/triển khai/khai triển ma trận (matrix decomposition) hay ma trận nhân tử (matrix factorization) là thực hiện phân tích thừa số/ nhân tử hóa (factorization) của một ma trận thành tích của nhiều ma trận. Có nhiều loại phân tích ma trận khác nhau. Một số các phân tích ma trận dựa trên giá trị riêng và vector riêng có thể kể đến như sau:
§  Eigenvalue decomposition (phân tích giá trị riêng)
§  Jordan decomposition
§  Schur decomposition
§  Singular value decomposition (SVD - phân tích giá trị kỳ dị/đặc biệt/đơn)

§  

2016-01-11

Linear Algebra: Linear mapping/map (ánh xạ tuyến tính)

Note lại 1 số kiến thức nền về đại số tuyến tính có liên quan đến đủ mọi thứ như SVD, PCA, optimization ... (không đầy đủ, xem thêm trong các tài liệu khác).

Linear Algebra MIT OCW

Search Results

Linear Algebra Done Right, by Sheldon Axler (Author), ISBN-13: 978-3319110790
...

Phần liên quan Matrices, Vectors, Eigenvectors & eigenvaluesBilinear form and Quadratic form

Linear mapping/map (ánh xạ tuyến tính)


Quan hệ hay liên hệ giữa các tập hợp được biểu diễn bằng ánh xạ.
Với không gian vector thì ánh xạ này cần thể hiện liên hệ của cả những phép toán toán (operator) khi giữa các không gian vector.

Đồng cấu (homomorphism)

Định nghĩa 1
Giả sử V và W là hai không gian vector trên trường K. Một ánh xạ f từ V đến W ký hiệu là \(f:V \to W\) gọi là một ánh xạ tuyến tính (linear mapping or linear transformation) hay một đồng cấu (hay cấu xạ đồng nhất homomorphism, cấu xạ-morphism mang ý nghĩa là ánh xạ bảo toàn cấu trúc structure-preserving map).

Nếu với \(\forall x,y \in V,\forall k \in K\):

1.      \(f(x + y) = f(x) + f(y)\)
2.      \(f(kx) = kf(x)\)

Khi đó \(f(x)\) được gọi là ảnh của x. Nếu \(W = V\) thì f được gọi là tự đồng cấu (endomorphism). Tự đồng cấu \(f:V \to V\) còn gọi là toán tử tuyến tính (linear operator).

Hệ quả
1.      Giả sử V và W là hai không gian vector trên trường K. Một ánh xạ f từ V đến W ký hiệu là \(f:V \to W\) gọi là một ánh xạ tuyến tính khi và chỉ khi \(f(rx + sy) = rf(x) + sf(y),\forall x,y \in V,\forall r,s \in K\)
2.      Nếu \(f:V \to W\) là một ánh xạ tuyến tính thì \(f({\vec 0_v}) = {\vec 0_W}\)
Ví dụ: \(f:{R^3} \to {R^2}\) xác định bởi \(f(({a_1},{a_2},{a_3})) = ({a_1},{a_2})\) là một đồng cấu (kiểm tra bằng định nghĩa).

Định nghĩa 2
Một ánh xạ tuyến tính (đồng cấu) được gọi là:

§  Đơn cấu (monomorphism) nếu nó là một đơn ánh (injective/injection)
§  Toàn cấu (epimorphism) nếu nó là một toàn ánh (surjective/surjection)
§  Đẳng cấu (isomorphism) nếu nó đồng thời là đơn ánh và toàn ánh (hay song ánh-bijective/bijection).
§  Tự đẳng cấu (automorphism) nếu là vừa là tự đồng cấu và đẳng cấu

Khi có một đẳng cấu từ không gian vector V sang W ký hiệu \(f:V \cong W\) thì V, W được gọi là đẳng cấu với nhau.

Ánh xạ tuyến tính \(f:V \to W\) là một đẳng cấu khi và chỉ khi tồn tại một ánh xạ tuyến tính \({f^{ - 1}}:W \to V\) sao cho \({f^{ - 1}}f = {1_V},f{f^{ - 1}} = {1_W}\).

Chứng minh: nếu f là một đẳng cấu thì tồn tại một ánh xạ ngược \({f^{ - 1}}\), dùng điều kiện chứng minh \({f^{ - 1}}\) là một ánh xạ tuyến tính theo định nghĩa. Ngược lại nếu tồn tại một ánh xạ tuyến tính \({f^{ - 1}}:W \to V\) sao cho \({f^{ - 1}}f = {1_V},f{f^{ - 1}} = {1_W}\) thì f là một song ánh, theo định nghĩa f là đẳng cấu.
Ví dụ: \(f:{R^3} \to {R^2}\) xác định bởi \(f(({a_1},{a_2},{a_3})) = ({a_1},{a_2})\) là một toàn cấu bởi vì \(\forall \beta ({a_1},{a_2}) \in {R^2}\) đều \(\exists \alpha ({a_1},{a_2},0) \in {R^3}\) sao cho \(f(\alpha ) = \beta \).

Sự xác định của một ánh xạ tuyến tính

Định lý
Giả sử V và W là hai không gian vector trên trường K, \(\beta  = \{ {b_1},...,{b_n}\} \) là một cơ sở của V và \({x_1}, \ldots ,{x_n}\) là n vector tùy ý của W. Khi đó tồn tại duy nhất một ánh xạ tuyến tính \(f:V \to W\) sao cho \(f({b_i}) = {x_i},\forall i = \overline {1,n} \).
Với \(u = {r_1}{b_1} + {r_2}{b_2} + ... + {r_n}{b_n}\) chọn f xác định như sau \(f(u) = {r_1}{x_1} + {r_2}{x_2} + ... + {r_n}{x_n} \in W\). Do \(\beta  = \{ {b_1},...,{b_n}\} \) là cơ sở của V nên \(u,{r_i},n\) được xác định duy nhất hay \(f(u)\) xác định duy nhất, do đó f là một ánh xạ.


Chứng minh f là một ánh xạ tuyến tính.
Với \(u = {r_1}{b_1} + {r_2}{b_2} + ... + {r_n}{b_n},v = {s_1}{b_1} + {s_2}{b_2} + ... + {s_n}{b_n} \in V,\forall k \in K\):
\(\begin{array}{l}u + v = ({r_1} + {s_1}){b_1} + ({r_2} + {s_2}){b_2} + ... + ({r_n} + {s_n}){b_n}\\ku = k{r_1}{b_1} + k{r_2}{b_2} + ... + k{r_n}{b_n}\end{array}\)

Theo định nghĩa của f:
\(\begin{array}{l}f(u + v) = ({r_1} + {s_1}){x_1} + ({r_2} + {s_2}){x_2} + ... + ({r_n} + {s_n}){x_n} = f(u) + f(v)\\f(ku) = k{r_1}{x_1} + k{r_2}{x_2} + ... + k{r_n}{x_n} = kf(u)\end{array}\)
Hơn nữa có thể viết \({b_i} = 0{b_1} + 0{b_2} + ... + {b_i} + ... + 0{b_n},\forall {b_i} \Rightarrow f({b_i}) = {x_i}\) .

Để kiểm tra tính duy nhất của f, giả sử tồn tại một ánh xạ tuyến tính \(f\prime :V \to W\) thỏa mãn điều kiện \(f\prime ({b_i}) = {x_i},\forall i = \overline {1,n} \). Do \(f\prime :V \to W\) là ánh xạ tuyến tính nên theo tính chất ánh xạ tuyến tính:
\(\begin{array}{l}f\prime (u) = f\prime ({r_1}{b_1} + {r_2}{b_2} + ... + {r_n}{b_n}) = {r_1}f\prime ({b_1}) + {r_2}f\prime ({b_2}) + ... + {r_n}f\prime ({b_n})\\ = {r_1}{x_1} + {r_2}{x_2} + ... + {r_n}{x_n} = f(u)\end{array}\)

Do đó \(f\prime  = f\) hay f là duy nhất.

Kết luận
§  Để xác định ánh xạ tuyến tính \(f:V \to W\) chỉ cần xác định ảnh của các vector cơ sở.
§  Mỗi hệ n vector của W xác định một ánh xạ tuyến tính từ V đến W nếu \(W \ne 0\).

Hạt nhân/Nhân và ảnh của ánh xạ tuyến tính (Kernel & image)

Định nghĩa
Giả sử V, W là hai không gian vector trên trường K, \(f:V \to W\) là một ánh xạ tuyến tính, \(A \subseteq V,B \subseteq W\) là các không gian con.

Ảnh của A, hay tập hợp ảnh của A (image) ký hiệu \(Im(A)\) xác định:
\(f(A) = \{ \beta  = f(\alpha ) \in W\left| {\alpha  \in A} \right.\} \) là tập hợp các ảnh của mọi vector \(\forall \alpha  \in A\) tạo do đồng cấu f.
Tập hợp \({f^{ - 1}}(B) = \{ \alpha  \in V\left| {f(\alpha ) \in B} \right.\} \) được gọi là tạo ảnh (ảnh ngược-preimage hay inverse image) của B.
Tập hợp f(V) gọi là ảnh của V hay còn gọi là ảnh của f \(Im(f)\).
Tập hợp \({f^{ - 1}}({\overrightarrow 0 _W})\) được gọi là hạt nhân của f và ký hiệu là \(Ker(f)\).

Định lý
Giả sử V, W là hai không gian vector trên trường K, \(f:V \to W\) là một ánh xạ tuyến tính, \(A \subseteq V,B \subseteq W\) là các không gian con. Khi đó:

1.      \(f(A)\) là một không gian con của W. Nếu hệ vector \(\{ {\varepsilon _1},{\varepsilon _2},...,{\varepsilon _n}\} \) là một hệ sinh của A thì hệ vector \(\{ f({\varepsilon _1}),f({\varepsilon _2}),...,f({\varepsilon _n})\} \) là một hệ sinh của \(f(A)\).
2.      \({f^{ - 1}}(B)\) là một không gian con của V.

Chứng minh:
Vì \({\overrightarrow 0 _V} \in A\) nên \(f({\overrightarrow 0 _V}) \in f(A)\) hay \(f(A) \ne \emptyset \) (1).

Giả sử \({\beta _1},{\beta _2} \in f(A);r,s \in K\), theo định nghĩa của \(f(A)\) là tập ảnh của A, tồn tại \({\alpha _1},{\alpha _2} \in A\) sao cho \(f({\alpha _1}) = {\beta _1},f({\alpha _2}) = {\beta _2}\).
Vì f là một ánh xạ tuyến tính nên \(r{\beta _1} + s{\beta _2} = rf({\alpha _1}) + sf({\alpha _2}) = f(r{\alpha _1}) + f(s{\alpha _2}) = f(r{\alpha _1} + s{\alpha _2})\). Do A là một không gian con của V nên theo tính chất không gian vector \(r{\alpha _1} + s{\alpha _2} \in A\), vì vậy \(r{\beta _1} + s{\beta _2} = f(r{\alpha _1} + s{\alpha _2}) \in f(A)\) (2).
Từ (1), (2) \(f(A) \subseteq W\).

Giả sử \(\{ {e_1},{e_2},...,{e_n}\} \) là một hệ sinh của A khi đó \(f({e_i}) \in f(A)\). Do \(\alpha \) là tổ hợp tuyến tính của hệ vector \(\{ {e_1},{e_2},...,{e_n}\} \) nên \(\alpha  = {x_1}{e_1} + {x_2}{e_2} +  \ldots  + {x_n}{e_n},f(\alpha ) = \beta \):
\(\beta  = f(\alpha ) = f({x_1}{e_1} + {x_2}{e_2} +  \ldots  + {x_n}{e_n}) = {x_1}f({e_1}) + {x_2}f({e_2}) +  \ldots  + {x_n}f({e_n})\)

Do đó hệ \(\{ f({e_1}),f({e_2}),...,f({e_n})\} \) là một hệ sinh của \(f(A)\).
Chứng minh tương tự \({f^{ - 1}}(B) \subseteq V\).

Hệ quả
Giả sử V, W là hai không gian vector trên trường K, \(f:V \to W\) là một ánh xạ tuyến tính

§  \(Im(f)\) là không gian con của W
§  \(Ker(f)\) là không gian con của V
§  f là một toàn cấu khi \(Im(f) = W\)
§  f là một đơn cấu khi và chỉ khi (iff), \(Ker(f) = {\overrightarrow 0 _V}\)

Giả sử f là một đơn cấu và \(\alpha  \in Ker(f)\), khi đó \(f(\alpha ) = {\overrightarrow 0 _W} = f({\overrightarrow 0 _V})\). Vì f là đơn cấu nên \(\alpha  = {\overrightarrow 0 _V}\) hay \(Ker(f) = \{ {\overrightarrow 0 _V}\} \)

Ngược lại nếu \(Ker(f) = \{ {\overrightarrow 0 _V}\} \), khi \(f({\alpha _1}) = f({\alpha _2})\) với \({\alpha _1},{\alpha _2} \in V\).
Xét \(f({\alpha _1} - {\alpha _2}) = f({\alpha _1}) - f({\alpha _2}) = {\overrightarrow 0 _W}\) do vậy \({\alpha _1} - {\alpha _2} \in Ker(f)\) hay \({\alpha _1} - {\alpha _2} = {\overrightarrow 0 _V} \Rightarrow {\alpha _1} = {\alpha _2}\).

Đẳng cấu giữa hai không gian cùng số chiều

Định lý
Hai không gian vector trên trường K đẳng cấu khi và chỉ khi có cùng số chiều.
Giả sử \(f:V \cong W\) là một đẳng cấu. Khi đó f đồng thời là một đơn cấu và toàn cấu.
Do đó \(Ker(f) = \overrightarrow 0 ,Im(f) = W\), khi đó
\(dim(V) = dim(W) + dim(Ker(f)) = dim(W) + 0 = \dim (W)\)

Ngược lại:
Giả sử \(\beta  = \{ {b_1},{b_2},...,{b_n}\} \) là cơ sở của V và \(\gamma  = \{ {g_1},{g_2},...,{g_n}\} \) là một cơ sở của W có cùng số chiều là n. Do đó có một ánh xạ tuyến tính \(f:V \to W\) sao cho \(f({b_i}) = {g_i},i = \overline {1,n} \). Khi đó hệ \(\gamma  = \{ {g_1},{g_2},...,{g_n}\} \) cũng là hệ sinh của \(Im(f)\) nên \(Im(f) = W\) nên f là toàn cấu.
Hơn nữa \(dim(Ker(f)) = dim(V) - dim(Im(f)) = 0\) nên f là một đơn cấu.

Kết luận f là một đẳng cấu nên V và W đẳng cấu với nhau.

Hệ quả 1
Giả sử V, W là hai không gian vector trên trường K, ánh xạ tuyến tính \(f:V \to W\) là một đẳng cấu khi và chỉ khi nó biến một cơ sở của V thành một cơ sở của W.

Hệ quả 2
Giả sử \(f:V \to V\) là toán tử tuyến tính, khi đó các mệnh đề sau tương đương:
1.      f đẳng cấu
2.      Tồn tại ánh xạ ngược \({f^{ - 1}}\)
3.      f đơn cấu
4.      f toàn cấu

Tọa độ biểu diễn vector (Coordinate representation of vector)

Định nghĩa
Nếu \(\beta  = \{ {b_1},...,{b_n}\} \) là một cở sở của không gian vector V trên trường K. Khi đó, \(\forall v \in V\) tồn tại duy nhất một bộ vô hướng \({a_1},{a_2}, \ldots ,{a_n} \in K\) sao cho:
\(v = {a_1}{b_1} + {a_2}{b_2} + ... + {a_n}{b_n}\)

Khi đó tọa độ (coordinate vector hay \(\beta \)– coordinates) của vector v đối với cơ sở \(\beta \) (to the ordered basic) được định nghĩa là vector cột (column vector) thuộc \({K^n}\) chứa các vô hướng \({a_i}\), ký hiệu:

\({\left[ v \right]_\beta } = \left[ {\begin{array}{*{20}{c}}{{a_1}}\\ \vdots \\{{a_n}}\end{array}} \right]\)

Khi đó vector V viết lại như sau:

\(v = {a_1}{b_1} + {a_2}{b_2} + ... + {a_n}{b_n} = \left[ {\begin{array}{*{20}{c}}{{b_1}}& \ldots &{{b_n}}\end{array}} \right]\left[ {\begin{array}{*{20}{c}}{{a_1}}\\ \vdots \\{{a_n}}\end{array}} \right] = B{\left[ v \right]_\beta }\)

Ánh xạ tọa độ (Coordinate mapping- coordinate isomorphism)
Nếu \(\beta  = \{ {b_1},...,{b_n}\} \) là một cơ sở của không gian vector V trên trường K. Khi đó tồn tại ánh xạ gọi là ánh xạ tọa độ (coordinate map) còn gọi là biểu diễn chuẩn (standard representation) của V đối với cơ sở \(\beta  = \{ {b_1},...,{b_n}\} \) từ V tới \({K^n}\) (hay còn ký hiệu là \({V_n}\)) ký hiệu \({\phi _\beta }:V \to {K^n}\) xác định bởi:

\({\phi _\beta }(v) = {\left[ v \right]_\beta }\)
\({\phi _\beta }:V \to {K^n}\) cũng là một ánh xạ tuyến tính (linear map hay linear transformation) hơn nữa nó còn là một đẳng cấu (isomorphism).

Chứng minh:

Để chứng minh \({\phi _\beta }\) là một đẳng cấu trước tiên phải chứng minh \({\phi _\beta }\) là một ánh xạ tuyến tính. Giả sử \(\forall x,y \in V\) do \(\beta  = \{ {b_1},...,{b_n}\} \) là cơ sở của V nên x, y có thể biểu diễn theo cơ sở này:

\(\begin{array}{l}x = {x_1}{b_1} + {x_2}{b_2} + ... + {x_n}{b_n}\\y = {y_1}{b_1} + {y_2}{b_2} + ... + {y_n}{b_n}\end{array}\)

Xét: \(x + y = ({x_1} + {y_1}){b_1} + ({x_2} + {y_2}){b_2} + ... + ({x_n} + {y_n}){b_n}\)
Và \(\forall k \in K\): \(kx = k{x_1}{b_1} + k{x_2}{b_2} + ... + k{x_n}{b_n}\)
\({\phi _\beta }(x + y) = {\left[ {x + y} \right]_\beta } = \left[ {\begin{array}{*{20}{c}}{{x_1} + {y_1}}\\ \vdots \\{{x_n} + {y_n}}\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}{{x_1}}\\ \vdots \\{{x_n}}\end{array}} \right] + \left[ {\begin{array}{*{20}{c}}{{y_1}}\\ \vdots \\{{y_n}}\end{array}} \right] = {\left[ x \right]_\beta } + {\left[ y \right]_\beta } = {\phi _\beta }(x) + {\phi _\beta }(y)\)


\({\phi _\beta }(kx) = {\left[ {kx} \right]_\beta } = \left[ {\begin{array}{*{20}{c}}{k{x_1}}\\ \vdots \\{k{x_n}}\end{array}} \right] = k\left[ {\begin{array}{*{20}{c}}{{x_1}}\\ \vdots \\{{x_n}}\end{array}} \right] = k{\left[ x \right]_\beta } = k{\phi _\beta }(x)\)

Do đó \({\phi _\beta }:V \to {K^n}\) là một ánh xạ tuyến tính.

Chứng minh ánh xạ tuyến tính \({\phi _\beta }\) là một đẳng cấu
Giả sử \(x,y \in V\) và \({\phi _\beta }(x) = {\phi _\beta }(y)\), khi đó \({\left[ x \right]_\beta } = {\left[ y \right]_\beta }\). Do dạng biểu diễn theo cơ sở \(\beta \) của một vector là duy nhất nên \(x = y\) hay \({\phi _\beta }\) là một đơn ánh.

Giả sử bất kỳ \({\left[ x \right]_\beta } = \left[ {\begin{array}{*{20}{c}}{{x_1}}\\ \vdots \\{{x_n}}\end{array}} \right] \in {K^n}\)

Xét \(x = {x_1}{b_1} + {x_2}{b_2} + ... + {x_n}{b_n} \in V\) thì \({\phi _\beta }(x) = {\left[ x \right]_\beta }\). Như vậy tất cả các phần tử của \({K^n}\) đều có tạo ảnh. Do đó \({\phi _\beta }\) là một toàn ánh.

Chuyển đổi tọa độ (Changing between coordinates with respect to two different bases)
Tổng quát cho không gian vector V trên trường K. Giả sử \(\beta  = \{ {b_1},...,{b_n}\} \), \(\gamma  = \{ {g_1},...,{g_n}\} \) là các cơ sở của V. Khi đó với \(\forall v \in V\): \({\left[ v \right]_\gamma } = {P_{\gamma  \leftarrow \beta }}{\left[ v \right]_\beta }\) với \({P_{\gamma  \leftarrow \beta }}\) là ma trận n×n gọi là ma trận chuyển đổi (cơ sở) (transition matrix) từ \(\beta \) sang \(\gamma \) tạo thành từ các vector cột là tọa độ của \({b_1},...,{b_n}\) theo cơ sở \(\gamma \).

Chứng minh:

Giả sử \(v = {x_1}{b_1} + ... + {x_n}{b_n}\) hay \({\left[ v \right]_\beta } = \left[ {\begin{array}{*{20}{c}}{{x_1}}\\ \vdots \\{{x_n}}\end{array}} \right]\)
Gọi các ánh xạ tọa độ tương ứng là \({\phi _\beta },{\phi _\gamma }:V \to {K^n}\)

Do \({\phi _\gamma }\) là ánh xạ tuyến tính nên:

\(\begin{array}{l}{\left[ v \right]_\gamma } = {\phi _\gamma }(v) = {\phi _\gamma }({x_1}{b_1} + ... + {x_n}{b_n}) = {\phi _\gamma }({x_1}{b_1}) + ... + {\phi _\gamma }({x_n}{b_n})\\ = {x_1}{\phi _\gamma }({b_1}) + ... + {x_n}{\phi _\gamma }({b_n}) = {x_1}{\left[ {{b_1}} \right]_\gamma } + ... + {x_n}{\left[ {{b_n}} \right]_\gamma } = \\ = \left[ {\begin{array}{*{20}{c}}{\left. {{{\left[ {{b_1}} \right]}_\gamma }} \right|}& \cdots &{\left| {{{\left[ {{b_n}} \right]}_\gamma }} \right.}\end{array}} \right]\left[ {\begin{array}{*{20}{c}}{{x_1}}\\ \vdots \\{{x_n}}\end{array}} \right] = {P_{\gamma  \leftarrow \beta }}{\left[ v \right]_\beta }\end{array}\)

Tổng quát với  \(\alpha ,\beta ,\gamma \) là cơ sở của V:

1.      \({P_{\alpha  \leftarrow \alpha }} = {I_n}\)
2.      \({P_{\alpha  \leftarrow \gamma }} = {P_{\alpha  \leftarrow \beta }}{P_{\beta  \leftarrow \gamma }}\)
3.      \({P_{\alpha  \leftarrow \beta }} = {({P_{\beta  \leftarrow \alpha }})^{ - 1}}\)

Chứng minh (2)
Với \(\forall v \in V\) theo định nghĩa:
\({P_{\alpha  \leftarrow \gamma }}{\left[ v \right]_\gamma } = {\left[ v \right]_\alpha } = {P_{\alpha  \leftarrow \beta }}{\left[ v \right]_\beta } = {P_{\alpha  \leftarrow \beta }}({P_{\beta  \leftarrow \gamma }}{\left[ v \right]_\gamma })\)
Theo tính chất phép nhân ma trận

\({P_{\alpha  \leftarrow \gamma }}{\left[ v \right]_\gamma } = {\left[ v \right]_\alpha } = {P_{\alpha  \leftarrow \beta }}{\left[ v \right]_\beta } = {P_{\alpha  \leftarrow \beta }}({P_{\beta  \leftarrow \gamma }}{\left[ v \right]_\gamma }) = ({P_{\alpha  \leftarrow \beta }}{P_{\beta  \leftarrow \gamma }}){\left[ v \right]_\gamma },\forall v \in V\)
Do đó  \({P_{\alpha  \leftarrow \gamma }} = {P_{\alpha  \leftarrow \beta }}{P_{\beta  \leftarrow \gamma }}\)

Chứng minh (3)
Theo (2) với \(\gamma  = \alpha \) có \({P_{\alpha  \leftarrow \gamma }} = {P_{\alpha  \leftarrow \beta }}{P_{\beta  \leftarrow \gamma }} \Leftrightarrow {P_{\alpha  \leftarrow \alpha }} = {P_{\alpha  \leftarrow \beta }}{P_{\beta  \leftarrow \alpha }} \Leftrightarrow {I_n} = {P_{\alpha  \leftarrow \beta }}{P_{\beta  \leftarrow \alpha }}\)

Ý nghĩa


Ánh xạ hợp \({\phi _\gamma } \circ {\phi _\beta }^{ - 1}:{K^n} \to {K^n}\) là một ánh xạ tuyến tính từ \({K^n}\) tới chính nó biểu diễn bởi: \(x \mapsto {P_{\gamma  \leftarrow \beta }}x\), trong đó \({P_{\gamma  \leftarrow \beta }}\) là ma trận n×n gọi là ma trận chuyển đổi (cơ sở) (transition matrix) từ \(\beta \) sang \(\gamma \) .

Chứng minh: dùng tính chất phép nhân ma trận.

Ma trận biểu diễn ánh xạ tuyến tính (Matrix representation of linear map)

Định nghĩa
Giả sử V và W là hai không gian vector trên trường K, \(\beta  = ({b_1},...,{b_n})\) là một cơ sở của V và \(\gamma  = ({g_1}, \ldots ,{g_m})\) là một cơ sở của W, \(f:V \to W\) là một ánh xạ tuyến tính từ V đến W.

Do các vector \({b_j} \in V \Rightarrow f({b_j}) \in W,j = \overline {1,n} \), mặc khác \(\gamma  = ({g_1}, \ldots ,{g_m})\) là một cơ sở của W nên \(f({b_j})\) có thể biểu diễn theo cơ sở \(\gamma  = ({g_1}, \ldots ,{g_m})\):

\(\begin{array}{l}f({b_j}) = {a_{1j}}{g_1} + {a_{2j}}{g_2} + ... + {a_{mj}}{g_m} = \sum\nolimits_{i = 1}^m {{a_{ij}}} {g_i},i = \overline {1,m} \\ \Rightarrow {\left[ {f({b_j})} \right]_\gamma } = \left[ {\begin{array}{*{20}{c}}{{a_{1j}}}\\ \vdots \\{{a_{mj}}}\end{array}} \right]\end{array}\)

Khi đó ma trận m×n \(A = ({a_{ij}})\) có các vector cột là tọa độ của \(f({b_j})\) trong cơ sở \(\gamma \) gọi là ma trận biểu diễn ánh xạ tuyến tính \(f:V \to W\) đối với cặp cơ sở \((\beta ,\gamma )\).

\(A = \left[ f \right]_\beta ^\gamma  = \left[ {\left. {{{\left[ {f({b_1})} \right]}_\gamma }} \right|\left. {{{\left[ {f({b_2})} \right]}_\gamma }} \right| \cdots \left| {{{\left[ {f({b_n})} \right]}_\gamma }} \right.} \right] = \left[ {\begin{array}{*{20}{c}}{{a_{11}}}& \ldots &{{a_{1n}}}\\ \vdots & \ddots & \vdots \\{{a_{m1}}}& \cdots &{{a_{mn}}}\end{array}} \right]\)

Trong trường hợp f là tự đồng cấu \(V = W\) và \(\beta  = \gamma \) có thể viết  \({\left[ f \right]_\beta }\) thay vì \(\left[ f \right]_\beta ^\beta \).

Định lý
Giả sử V và W là hai không gian vector trên trường K với cặp cơ sở \((\beta ,\gamma )\), \(f:V \to W\) là một ánh xạ tuyến tính từ V đến W, thì \(\forall u \in V\):
\({[f(u)]_\gamma } = \left[ f \right]_\beta ^\gamma {\left[ u \right]_\beta }\)

Chứng minh:

Do \(u \in V\) nên có thể biểu diễn bởi cơ sở \(\beta  = ({b_1},...,{b_n})\): \(u = \sum\nolimits_{j = 1}^n {{u_j}{b_j}} \)

Do f và \({\phi _\gamma }\) là ánh xạ tuyến tính nên theo tính chất của ánh xạ tuyến tính:
\(\begin{array}{l}f(u) = f(\sum\nolimits_{j = 1}^n {{u_j}{b_j}} ) = \sum\nolimits_{j = 1}^n {f({u_j}{b_j})}  = \sum\nolimits_{j = 1}^n {{u_j}f({b_j})} \\ \Rightarrow {\left[ {f(u)} \right]_\gamma } = {\phi _\gamma }(\sum\nolimits_{j = 1}^n {{u_j}f({b_j}))}  = \sum\nolimits_{j = 1}^n {{u_j}{\phi _\gamma }(f({b_j}))}  = {\sum\nolimits_{j = 1}^n {{u_j}\left[ {f({b_j})} \right]} _\gamma }\\ \Rightarrow {\left[ {f(u)} \right]_\gamma } = \left[ {\left. {{{\left[ {f({b_1})} \right]}_\gamma }} \right|\left. {{{\left[ {f({b_2})} \right]}_\gamma }} \right| \cdots \left| {{{\left[ {f({b_n})} \right]}_\gamma }} \right.} \right]\left[ {\begin{array}{*{20}{c}}{{u_1}}\\ \vdots \\{{u_n}}\end{array}} \right] = \left[ f \right]_\beta ^\gamma {\left[ u \right]_\beta }\end{array}\)
\({[f(u)]_\gamma } = \left[ f \right]_\beta ^\gamma {\left[ u \right]_\beta }\) còn gọi là biểu thức tọa độ của ánh xạ tuyến tính f đối với cặp cơ sở \((\beta ,\gamma )\).

Khi chỉ đề cập ánh xạ tuyến tính \(f:V \to W\) mà không chỉ định cặp cơ sở \((\beta ,\gamma )\) có nghĩa ngầm định ánh xạ được xét sử dụng cơ sở chính tắc của V, W. Ma trận trong cặp cơ sở chính tắc gọi là ma trận chính tắc.

Tổng hai ánh xạ tuyến tính (Sum of two linear maps)

Định nghĩa
Giả sử V và W là hai không gian vector trên trường K, f, g là ánh xạ tuyến tính từ V đến W \(f,g:V \to W\). Tổng của hai ánh xạ tuyến tính ký hiệu \(f + g\) được định nghĩa:
\((f + g)(x) = f(x) + g(x)\)

Ánh xạ tổng \(f + g\) của hai ánh xạ tuyến tính f và g là một ánh xạ tuyến tính.

Chứng minh:

Với \(\forall \alpha ,\beta  \in V,\forall r,s \in K\):
\(\begin{array}{l}(f + g)(r\alpha  + s\beta ) = f(r\alpha  + s\beta ) + g(r\alpha  + s\beta )\\ = rf(\alpha ) + sf(\beta ) + rg(\alpha ) + sg(\beta ) = r[f(\alpha ) + g(\alpha )] + s[f(\beta ) + g(\beta )]\\ = r(f + g)(\alpha ) + s(f + g)(\beta )\end{array}\)

Do đó \(f + g\) là một ánh xạ tuyến tính

Định lý
Giả sử V và W là hai không gian vector trên trường K lần lượt có cơ sở là \((\beta ,\gamma )\). Giả sử f, g là ánh xạ tuyến tính từ V đến W \(f,g:V \to W\) ứng với hai cơ sở \((\beta ,\gamma )\):
\([f + g]_\beta ^\gamma  = \left[ f \right]_\beta ^\gamma  + \left[ g \right]_\beta ^\gamma \)

Chứng minh:
Với \(f + g,{\phi _\gamma }\) là các ánh xạ tuyến tính, \(\forall u \in V\)
\(\begin{array}{l}{[(f + g)(u)]_\gamma } = {\phi _\gamma }((f + g)(u)) = {\phi _\gamma }(f(u) + g(u))\\ = {\phi _\gamma }(f(u)) + {\phi _\gamma }(g(u)) = {[f(u)]_\gamma } + {[g(u)]_\gamma }\end{array}\)

Mặc khác \({[(f + g)(u)]_\gamma } = \left[ {f + g} \right]_\beta ^\gamma {\left[ u \right]_\beta },{[f(u)]_\gamma } = \left[ f \right]_\beta ^\gamma {\left[ u \right]_\beta },{[g(u)]_\gamma } = \left[ g \right]_\beta ^\gamma {\left[ u \right]_\beta }\) nên
\(\left[ {f + g} \right]_\beta ^\gamma {\left[ u \right]_\beta } = \left[ f \right]_\beta ^\gamma {\left[ u \right]_\beta } + \left[ g \right]_\beta ^\gamma {\left[ u \right]_\beta } = (\left[ f \right]_\beta ^\gamma  + \left[ g \right]_\beta ^\gamma ){\left[ u \right]_\beta },\forall u \in V\)
\( \Rightarrow [f + g]_\beta ^\gamma  = \left[ f \right]_\beta ^\gamma  + \left[ g \right]_\beta ^\gamma \)

Tích của một ánh xạ tuyến tính với vô hướng (multiplication of linear maps with scalars)

Định nghĩa
Giả sử V và W là hai không gian vector trên trường K, f là ánh xạ tuyến tính từ V đến W \(f:V \to W\). Tích của một ánh xạ tuyến tính với vô hướng (scalar multiplication) \(k \in K\), ký hiệu \(kf\) được định nghĩa
\((kf)(x) = kf(x)\)

Với \(k =  - 1\) tích của ánh xạ f với k: \(( - 1)f\) gọi là ánh xạ đôi của f và ký hiệu là \( - f\).
Tích của một ánh xạ tuyến tính với vô hướng (scalar multiplication) là một ánh xạ tuyến tính.

Định lý
Giả sử V và W là hai không gian vector trên trường K với cặp cơ sở tương ứng là \((\beta ,\gamma )\). Giả sử f là một ánh xạ tuyến tính từ V đến W \(f:V \to W\), \(k \in K\)vô hướng (scalar multiplication).
\([kf]_\beta ^\gamma  = k\left[ f \right]_\beta ^\gamma \)

Tích của hai ánh xạ tuyến tính (multiplication of linear maps/composite of linear maps)

Định nghĩa
Giả sử V và W là hai không gian vector trên trường K, f, g là các ánh xạ tuyến tính \(f:V \to W,g:W \to U\). Tích của hai ánh xạ f và g ký hiệu là \(gf\) được xác định như sau:
\((gf)(x) = g(f(x))\)

Tích của hai ánh xạ tuyến tính cũng là một ánh xạ tuyến tính.

Chứng minh:

Với \(\forall \alpha ,\beta  \in V,\forall r,s \in K\):
\(\begin{array}{l}(gf)(r\alpha  + s\beta ) = g(f(r\alpha  + s\beta )) = g(f(r\alpha )) + g(f(s\beta ))\\ = g(rf(\alpha )) + g(sf(\beta )) = r(gf)(\alpha ) + s(gf)(\beta )\end{array}\)

Do đó \(gf\) là một ánh xạ tuyến tính.
Tích của hai ánh xạ tuyến tính còn gọi là hợp của hai ánh xạ tuyến tính (composite of two linear maps) và ký hiệu là \(g \circ f\)

Tương đương với phép nhân ma trận (Equivalence of composition and matrix multiplication)
Giả sử V, W, và Z là các không gian vector trên trường K lần lượt có các cơ sở là \(\alpha ,\beta ,\gamma \). Giả sử f, g là hai ánh xạ tuyến tính \(f:U \to V,g:V \to W\):
\([gf]_\alpha ^\gamma  = \left[ g \right]_\beta ^\gamma \left[ f \right]_\alpha ^\beta \)


Chứng minh:

Giả sử \(\alpha  = ({u_1},{u_2},...,{u_p}),\beta  = ({v_1},{v_2},...,{v_n}),\gamma  = ({w_1},{w_2},...,{w_m})\)

Do \({u_i} \in U \Rightarrow f({u_i}) \in V,i = \overline {1,p} \), ma trận chuyển đổi n×p từ \(\alpha  \to \beta \) tương ứng \(f({u_i}) = \sum\nolimits_{j = 1}^n {{a_{ji}}{v_j}} ,j = \overline {1,n} \)
\(\left[ f \right]_\alpha ^\beta  = \left[ {\begin{array}{*{20}{c}}{{a_{11}}}& \ldots &{{a_{1p}}}\\ \vdots & \ddots & \vdots \\{{a_{n1}}}& \cdots &{{a_{np}}}\end{array}} \right]\)

Tương tự do \({v_j} \in V \Rightarrow g({v_j}) \in W,j = \overline {1,n} \), ma trận chuyển đổi m×n từ \(\beta  \to \gamma \) tương ứng \(g({v_j}) = \sum\nolimits_{k = 1}^m {{b_{kj}}{w_k}} ,k = \overline {1,m} \)
\(\left[ g \right]_\beta ^\gamma  = \left[ {\begin{array}{*{20}{c}}{{b_{11}}}& \ldots &{{b_{1n}}}\\ \vdots & \ddots & \vdots \\{{b_{m1}}}& \cdots &{{b_{mn}}}\end{array}} \right]\)

Do đó \(g(f({u_i})) = g(\sum\nolimits_{j = 1}^n {{a_{ji}}{v_j}} ) = \sum\nolimits_{j = 1}^n {{a_{ji}}g({v_j})}  = \sum\nolimits_{j = 1}^n {{a_{ji}}\sum\nolimits_{k = 1}^m {{b_{kj}}{w_k}} } \)

Đổi thứ tự tính tổng \(g(f({u_i})) = \sum\nolimits_{j = 1}^n {{a_{ji}}\sum\nolimits_{k = 1}^m {{b_{kj}}{w_k}} }  = \sum\nolimits_{k = 1}^m {(\sum\nolimits_{j = 1}^n {{b_{kj}}{a_{ji}}} ){w_k}} \)

Đặt \({c_{ki}} = \sum\nolimits_{j = 1}^n {{b_{kj}}{a_{ji}}} \] khi đó: \(gf({u_i}) = g(f({u_i})) = \sum\nolimits_{k = 1}^m {{c_{ki}}{w_k}} \).

Theo định nghĩa, ma trận chuyển đổi m×p từ \(\alpha  \to \gamma \) là:
\([gf]_\alpha ^\gamma  = \left[ {\begin{array}{*{20}{c}}{{c_{11}}}& \ldots &{{c_{1p}}}\\ \vdots & \ddots & \vdots \\{{c_{m1}}}& \cdots &{{c_{mp}}}\end{array}} \right]\)

Như do \({c_{ki}} = \sum\nolimits_{j = 1}^n {{b_{kj}}{a_{ji}}} \) nên \([gf]_\alpha ^\gamma  = \left[ g \right]_\beta ^\gamma \left[ f \right]_\alpha ^\beta \).

Định lý
Giả sử f, g, h là các ánh xạ tuyến tính. Khi đó
\(\begin{array}{l}h(gf) = (hg)f\\h(f + g) = hf + hg\\(f + g)h = fh + gh\end{array}\)
nếu các phép toán của hai vế đều có nghĩa.

Chứng minh:

Giả sử f, g,h là các ánh xạ tuyến tính \(f,g:V \to W,h:W \to U\).
Với \(\forall x \in V\):

\(\begin{array}{l}(f + g)(x) = f(x) + g(x)\\h(f + g)(x) = h((f + g)(x)) = h(f(x) + g(x))\\ = h(f(x)) + h(g(x)) = (hf)(x) + (hg)(x)\\ = (hf + hg)(x)\end{array}\)

Đổi cơ sở của ánh xạ tuyến tính (Change of basis for a linear map)

Giả sử V và W là hai không gian vector trên trường K có các cặp cơ sở \((\beta ,\gamma ),(\beta \prime ,\gamma \prime )\), \(f:V \to W\) là một ánh xạ tuyến tính từ V đến W với các ma trận tương ứng là A, B. Nếu \(P = {P_{\beta  \leftarrow \beta \prime }}\) và \(Q = {Q_{\gamma  \leftarrow \gamma \prime }}\) là các ma trận đổi cơ sở từ \(\beta  \leftarrow \beta \prime \) và \(\gamma  \leftarrow \gamma \prime \) thì \(B = {Q^{ - 1}}AP\)



Giả sử V là không gian vector trên trường K có các cơ sở \(\beta ,\gamma \), \(f:V \to V\) là một toán tử tuyến tính (tự đồng cấu) với các ma trận tương ứng với hai cơ sở là A, B. Nếu \(P = {P_{\beta  \leftarrow \gamma }}\) là ma trận đổi cơ sở từ \(\gamma  \to \beta \) thì \(B = {P^{ - 1}}AP\)





Linear Algebra: Matrices (note lại Đại số tuyến tính: Ma trận)

Note lại 1 số kiến thức nền về đại số tuyến tính có liên quan đến đủ mọi thứ như SVD, PCA, optimization ... (không đầy đủ, xem thêm trong các tài liệu khác).

Linear Algebra MIT OCW

Search Results

Linear Algebra Done Right, by Sheldon Axler (Author), ISBN-13: 978-3319110790
...

Tiếp theo phần đầu về Vectors
Phần kế tiếp về Eigenvectors and Eigenvalues (vector riêng/đặc trưng và giá trị riêng/đặc trưng)

Matrices


Ma trận một bảng (a table consists rows and columns) gồm m×n số thực được sắp xếp thành m dòng, n cột và gọi là ma trận cấp m×n.

Matrix notation


Ký pháp/ký hiệu biểu diễn ma trận
\(A = \left( {\begin{array}{*{20}{c}}{{{\rm{a}}_{11}}}&{{{\rm{a}}_{12}}}& \cdots &{{{\rm{a}}_{1{\rm{n}}}}\;}\\{{{\rm{a}}_{21}}}&{{{\rm{a}}_{22}}}& \cdots &{{{\rm{a}}_{2{\rm{n}}}}}\\ \vdots & \vdots & \ddots & \vdots \\{{{\rm{a}}_{{\rm{m}}1}}}&{{{\rm{a}}_{{\rm{m}}2}}}& \cdots &{{{\rm{a}}_{{\rm{mn}}}}}\end{array}\;} \right)\) hoặc \(A = \left[ {\begin{array}{*{20}{c}}{{{\rm{a}}_{11}}}&{{{\rm{a}}_{12}}}& \cdots &{{{\rm{a}}_{1{\rm{n}}}}\;}\\{{{\rm{a}}_{21}}}&{{{\rm{a}}_{22}}}& \cdots &{{{\rm{a}}_{2{\rm{n}}}}}\\ \vdots & \vdots & \ddots & \vdots \\{{{\rm{a}}_{{\rm{m}}1}}}&{{{\rm{a}}_{{\rm{m}}2}}}& \cdots &{{{\rm{a}}_{{\rm{mn}}}}}\end{array}} \right]\)
hoặc 
\(A = {\left( {{a_{ij}}} \right)_{m \times n}}\)
Dãy số\(\;{A_{\left( i \right)}} = \left( {{a_{i1}}, \ldots ,{a_{in}}} \right)\) gọi là dòng thứ i của A và \({A^{\left( j \right)}} = \left( {{a_{1j}}, \ldots ,{a_{mj}}} \right)\) gọi là cột thứ j của A
Trong đó \({a_{ij}}\) là phần tử của ma trận nằm trên dòng i, cột j với \(i = 1,2,...,m\)và \(j = 1,2,...,n\)
Với ma trân vuông (square matrix) n×n, các phần tử \({a_{ii}}\)gọi là phần tử nằm trên đường chéo chính.

Diagonal matrix (ma trận chéo)


Ma trận (đường) chéo thường là ma trận vuông có các phần tử nằm trên đường chéo chính khác 0, mọi phần tử nằm ngoài đường chéo chính bằng 0.
\({d_{ij}} = 0,\;i \ne j\;\forall i,j \in \left\{ {1,2, \ldots ,n} \right\}\)
Ma trận đường chéo có dạng:
\(D = \left[ {\begin{array}{*{20}{c}}{{{\rm{a}}_{11}}}&0& \cdots &{0\;}\\0&{{{\rm{a}}_{22}}}& \cdots &0\\ \vdots & \vdots & \ddots & \vdots \\0&0& \cdots &{{{\rm{a}}_{{\rm{nn}}}}}\end{array}} \right]\)

Identity matrix (ma trận đơn vị)


Ma trận đơn vị (identity matrix còn gọi là unix matrix) cấp n là ma trận vuông n×n có mọi phần tử nằm trên đường chéo chính bằng 1, các phần tử khác bằng 0, và có dạng sau:
\({I_n} = \left[ {\begin{array}{*{20}{c}}1&0& \cdots &{0\;}\\0&1& \cdots &0\\ \vdots & \vdots & \ddots & \vdots \\0&0& \cdots &1\end{array}} \right]\)
Đôi khi sử dụng ký pháp/ký hiệu (notation) dùng mô tả ma trận (đường) chéo \({I_n} = diag\left( {1,1, \ldots ,1} \right)\)
hoặc dùng ký pháp Kronecker delta (Kronecker delta notation) \({\left( {{I_n}} \right)_{ij}} = {\delta _{ij}}\)
Với A là ma trận m×n \({I_m}A = A{I_n} = A\) (xem Matrix multiplication)

Matrix multiplication (nhân ma trận)


Tích của ma trận A mxp và ma trận B pxn là một ma trận kích thước m×n như sau:
\({\left[ {AB} \right]_{ij}} = {A_{i1}}{B_{1j}} + {A_{i2}}{B_{2j}} + ... + {A_{in}}{B_{nj}} = \sum\limits_{r = 1}^n {{A_{ir}}} {B_{rj}}\)
Tích hai ma trận AB có thể xác định (defined) trong khi BA không xác định. Cụ thể A là ma trận m×n và B là ma trận nxk tương ứng k ≠ n. Ngay cả khi AB và BA xác định thì thông thường AB ≠ BA.
\(A = \left[ {\begin{array}{*{20}{c}}2&1&4\\1&5&2\end{array}} \right]\)
\(B = \left[ {\begin{array}{*{20}{c}}3&2\\{ - 1}&4\\1&2\end{array}} \right]\)
\(AB = \left[ {\begin{array}{*{20}{c}}2&1&4\\1&5&2\end{array}} \right]\left[ {\begin{array}{*{20}{c}}3&2\\{ - 1}&4\\1&2\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}9&{16}\\0&{26}\end{array}} \right]\)
\({\left( {ab} \right)_{11}} = \left[ {\begin{array}{*{20}{c}}2&1&4\end{array}} \right]\left[ {\begin{array}{*{20}{c}}3\\{ - 1}\\{ - 1}\end{array}} \right] = 2\left( 3 \right) + 1\left( { - 1} \right) + 4\left( 1 \right) = 9\)
\({\left( {ab} \right)_{12}} = \left[ {\begin{array}{*{20}{c}}2&1&4\end{array}} \right]\left[ {\begin{array}{*{20}{c}}2\\4\\2\end{array}} \right] = 2\left( 2 \right) + 1\left( 4 \right) + 4\left( 2 \right) = 16\)
\({\left( {ab} \right)_{21}} = \left[ {\begin{array}{*{20}{c}}1&5&2\end{array}} \right]\left[ {\begin{array}{*{20}{c}}3\\{ - 1}\\{ - 1}\end{array}} \right] = 1\left( 3 \right) + 5\left( { - 1} \right) + 2\left( 1 \right) = 0\)
\({\left( {ab} \right)_{21}} = \left[ {\begin{array}{*{20}{c}}1&5&2\end{array}} \right]\left[ {\begin{array}{*{20}{c}}2\\4\\2\end{array}} \right] = 1\left( 2 \right) + 5\left( 4 \right) + 2\left( 2 \right) = 26\)

Transposition (chuyển vị ma trận)


Chuyển vị (chuyển đổi vị trí) của một ma trận A (the transpose of a matrix A) là một ma trận ký hiệu \({A^T}\) (có khi còn ký hiệu \(A\prime \)\({A^{tr}}\) hay \({A^t}\)) có các dòng là các cột của ma trận A (giữ nguyên thứ tự). Nếu A là một ma trận m×n thì \({A^T}\)là ma trận nxm.
\({\left[ {{A^T}} \right]_{ij}} = {\left[ A \right]_{ji}}\)
Ví dụ:
\(A = \left[ {\begin{array}{*{20}{c}}1&2&3\\4&5&6\end{array}} \right]\)thì chuyển vị của ma trận A là\({A^T} = \left[ {\begin{array}{*{20}{c}}1&4\\2&5\\3&6\end{array}} \right]\)
Một số tính chất
\({\left( {{A^T}} \right)^T} = A\)
\({\left( {A + B} \right)^T} = {A^T} + {B^T}\)
\({\left( {AB} \right)^T} = {B^T}{A^T}\)
\({\left( {cA} \right)^T} = c{A^T}\)
\(det({A^T}) = det(A)\) (với ma trận vuông xem Determinant)
\({\left( {{A^T}} \right)^{ - 1}} = {\left( {{A^{ - 1}}} \right)^T}\)

Symmetric matrices (ma trận đối xứng)


Một ma trận vuông gọi là đối xứng (symmetric matrix) nếu chuyển vị của nó bằng chính nó \({A^T} = A\)Có thể tạo ma trận đối xứng từ một ma trận \({A_{m \times n}}\)bằng cách nhân nó với chuyển vị của nó: các ma trận\({B_{m \times m}} = A{A^T}\) và \({C_{n \times n}} = {A^T}A\) là các ma trận đối xứng.
Nếu A là ma trận vuông thì ma trận có được bằng cách cộng nó với chuyển vị của nó là ma trận đối xứng \({B_{n \times n}} = A + {A^T}\).
Nếu \({A^T} =  - A\) thì \(A\) gọi là ma trận phản đối xứng/phản xứng (antisymmetric/antimetric hay skew-symmetric  đối xứng lệch).
Định lý (theorem):
1.      Tất cả cả eigenvalues của ma trận đối xứng đều là số thực.
2.      Ma trận đới xứng thực cấp n×n có các eigenvectors (xem Eigenvectors) ứng với các eigenvalues phân biệt  thì trực giao lẫn nhau.
Chứng minh 1:
Cho A là ma trận đối xứng \({A^T} = A\).
Với \(\lambda \) là trị riêng của ma trận A: \(Ax = \lambda x\) với \(x \ne 0\)
Xét: \(\left\langle {Ax,x} \right\rangle  = \left\langle {\lambda x,x} \right\rangle  = \lambda \left\langle {x,x} \right\rangle \)
Mặt khác: \(\left\langle {Ax,x} \right\rangle  = \left\langle {x,{A^T}x} \right\rangle  = \left\langle {x,Ax} \right\rangle  = \left\langle {x,\lambda x} \right\rangle  = \bar \lambda \left\langle {x,x} \right\rangle \)
Do đó \((\lambda  - \bar \lambda )\left\langle {x,x} \right\rangle  = 0\) vì \(\left\langle {x,x} \right\rangle  > 0\) nên \(\lambda \) là số thực.

Chứng minh 2:
Chứng minh các eigenvectors ứng với các eigenvalues phân biệt thì trực giao lẫn nhau.
Giả sử có \(A{v_1} = {\lambda _1}{v_1},A{v_2} = {\lambda _2}{v_2}\) với \({v_1} \ne 0,{v_2} \ne 0,{\lambda _1} \ne {\lambda _2}\).
Khi đó \(\left\langle {A{v_1},{v_2}} \right\rangle  = \left\langle {{\lambda _1}{v_1},{v_2}} \right\rangle  = {\lambda _1}\left\langle {{v_1},{v_2}} \right\rangle \).
Với \({A^T} = A\) và \(A{v_2} = {\lambda _2}{v_2}\) thì \(\left\langle {A{v_1},{v_2}} \right\rangle  = \left\langle {{v_1},{A^T}{v_2}} \right\rangle  = \left\langle {{v_1},A{v_2}} \right\rangle  = {\lambda _2}\left\langle {{v_1},{v_2}} \right\rangle \).
Như vậy \({\lambda _1}\left\langle {{v_1},{v_2}} \right\rangle  = {\lambda _2}\left\langle {{v_1},{v_2}} \right\rangle \) và do \({\lambda _1} \ne {\lambda _2}\) nên \(\left\langle {{v_1},{v_2}} \right\rangle  = 0\).
Mở rộng eigenspaces tương ứng với \({\lambda _1},{\lambda _2}\) trực giao nhau.


Orthogonal matrix (ma trận trực giao)


Ma trận vuông A được gọi là ma trận trực giao nếu \({A^T}A = A{A^T} = I\)

Unitary matrix (ma trận Unitary/Unita)


Ma trận A được gọi là ma trận unitary nếu liên hợp chuyển vị của nó cũng chính là ma trận nghịch đảo của nó \({A^*}A = A{A^*} = I\).
Tính chất:
§  U khả nghịch và \({U^{ - 1}} = {U^*}\)
§  Với \(\forall x \in {C^n}\) thì \({\left\| {Ux} \right\|_2} = {\left\| x \right\|_2}\)
§  Với \(\forall x,y \in {C^n}\) thì \(\left\langle {Ux,Uy} \right\rangle  = \left\langle {x,y} \right\rangle \)
§  Nếu \(A = {A^*}\) là ma trận Hermitian thì tồn tại một ma trận unitary \(U\)sao cho \({U^*}AU\)là ma trận chéo.
§  Với mọi ma trận \(A \in {R^{m \times n}}\)cả \({A^*}A \in {R^{n \times n}}\)và \(A{A^*} \in {R^{m \times m}}\) đều là ma trận Hermitian và có thể chéo hóa (diagonalized) bởi ma trận unitary.

Xem thêm phân tích Schur (Schur decomposition).

Hermitian/Hermite matrix (ma trận Hermitian/Hermite)


Ma trận Hermitian/Hermite là một ma trận vuông có các phần tử là số phức bằng liên hợp chuyển vị (conjugate transpose) của nó, nghĩa là phần từ ở hàng i cột j bằng số phức liên hợp của phần tử ở hàng j cột i hay \(A = {A^*} \equiv {\bar A^T} = \overline {{A^T}} \).
Liên hợp chuyển vị còn gọi là liên hợp phức của ma trận chuyển vị (complex conjugate of the transpose) hay chuyển vị Hermitian (Hermitian transpose). Ký hiệu \(\bar A\)là ma trận liên hợp của A. Hai toán tử chuyển vị và liên hợp có thể giao hoán (commutable) nhau nên\({A^*} \equiv {\bar A^T} = \overline {{A^T}} \). Liên hợp chuyển vị của ma trận A cũng hay được ký hiệu là \({A^H}\).

Ví dụ:
\(A = \left[ {\begin{array}{*{20}{c}}1&{ - 2 - i}\\{1 + i}&i\end{array}} \right]\) thì \({A^T} = \left[ {\begin{array}{*{20}{c}}1&{1 + i}\\{ - 2 - i}&i\end{array}} \right]\) chuyển vị liên hợp của A là \({A^*} = \left[ {\begin{array}{*{20}{c}}1&{1 - i}\\{ - 2 + i}&{ - i}\end{array}} \right]\)
\(A = \left[ {\begin{array}{*{20}{c}}3&{2 + i}\\{2 - i}&1\end{array}} \right]\) là ma trận Hermitian.

Positive definite matrix (ma trận xác định dương)


Một ma trận A vuông đối xứng cấp n trên trường số thực (a symmetric n×n real matrix) được gọi là xác định dương (positive definite ký hiệu là PD) nếu vô hướng \({x^T}Ax\) dương với mọi vector cột khác không \(x \in {R^n}\) (\({x^T}\)là chuyển vị của x).
Tổng quát, một ma trận Hermitian A được gọi là positive definite nếu vô hướng \({x^*}Ax\)là số thực dương với mọi vector cột khác zero \(x \in {C^n}\) (\({x^*}\) là liên hợp chuyển vị – conjugate transpose của x). Khi đó ma trận A ký hiệu là \(A \succ 0\) (hay  với positive semi-definite).
Các ma trận negative definitepositive semi-definite, và negative semi-definite được định nghĩa tương tự khi \({x^T}Ax\) hay \({x^*}Ax\)tương ứng phải âm, không âm hoặc không dương.
Ví dụ: ma trận đối xứng số thực \(A = \left[ {\begin{array}{*{20}{c}}2&{ - 1}&0\\{ - 1}&2&{ - 1}\\0&{ - 1}&2\end{array}} \right]\) là positive definite.
Với \(x = \left[ {\begin{array}{*{20}{c}}a\\b\\c\end{array}} \right] \ne 0\) thì \({x^T}Ax\) tính như sau:
\({x^T}Ax = ({x^T}A)x = 2{a^2} - 2ab + 2{b^2} - 2bc + 2{c^2}\)
\( = {a^2} + {(a - b)^2} + {(b - c)^2} + {c^2} > 0\) (a,b,c không đồng thời bằng 0).
Cho A là ma trận n×n Hermitian, nếu A positive definite:
§  Tất cả các giá trị riêng \({\lambda _1},{\lambda _2}, \ldots ,{\lambda _p}\) đều dương. Ngược lại nếu tất cả các trị riêng của ma trận A đối xứng vuông cấp n đều dương thì A gọi là positive definite matrix.
§  Với \(1 \le r \le n\) ma trận con (submatrix) r×r \({A_r}\) cũng positive definite.
§  Tồn tại duy nhất một phân tích/khai triển của A (a unique decomposition of A) dạng \(A = L{L^*}\)với L là ma trận tam giác dưới (lower triangular matrix) còn gọi là phân tích Cholesky (Cholesky decomposition) của ma trận A (\({L^*}\) là conjugate transpose của L).
§  Tồn tại duy nhất một phân tích/khai triển của A dạng \(A = SS\) hay có thể viết \(S = {A^{1/2}}\)gọi là căn bậc 2 của ma trận A (matrix square root of A).
§  Tồn tại duy nhất một phân tích/khai triển của A dạng gọi là phân tích giá trị kỳ dị/đặc biệt/đơn (Singular value decomposition – SVD)

Trace (vết của ma trận)


Trace của một ma trận vuông cấp n được định nghĩa là tổng của các phần tử trên đường chéo chính (từ góc trên bên trái xuống góc dưới bên phải) ký hiệu là tr(A) hay sp(A) (spur trong tiếng Đức). Tương đương với vết của ma trận là tổng của các giá trị riêng eigenvalues (phức) (xem phần Eigenvectors and Eigenvalues).
\(tr(A) = {a_{11}} + {a_{12}} +  \ldots  + {a_{nn}} = \sum\limits_{i = 1}^n {{a_{ii}}} \)
Một số tính chất:
\(tr(A) = tr({A^T})\)
Cho A là ma trận vuông bất kỳ cấp n. P là ma trận vuông khả nghịch. Liên hợp của A theo P là \({P^{ - 1}}AP\)
\(tr({P^{ - 1}}AP) = tr({P^{ - 1}}(AP)) = tr((AP){P^{ - 1}}) = tr(A(P{P^{ - 1}})) = tr(A)\)

Matrix norm (chuẩn của ma trận)


Cho ma trận A là ma trận vuông m×n, chuẩn của ma trận A ký hiệu là \(\left\| A \right\|\)là một số không âm thỏa mãn:
1.     Positivity:\(\left\| A \right\| \ge 0\) và \(\left\| A \right\| = 0\) khi và chỉ khi \(A = 0\)
2.     Homogeneity: \(\left\| {\alpha A} \right\| = \left| \alpha  \right|\left\| A \right\|\) với mọi \(\alpha  \in R\)
3.     Triangle inequality: \(\left\| {A + B} \right\| \le \left\| A \right\| + \left\| B \right\|\) (bất đẳng thức tam giác)

Induced norm/Operator norm (chuẩn toán tử)


Nếu có các chuẩn vector trên \({K^m}\) và \({K^n}\) (với K là trường số thực hay số phức), thì định nghĩa chuẩn toán tử của một ma trận m×n ứng với chuẩn p của vector như sau với bất kỳ \(x \in {K^n}\):
${\left\| A \right\|_p} = \mathop {\sup }\limits_{x \ne 0} \frac{{{{\left\| {Ax} \right\|}_p}}}{{{{\left\| x \right\|}_p}}}$
Trường hợp đặc biệt \(p = 1\), chuẩn toán tử trở thành chuẩn cực đại tổng theo cột
${\left\| A \right\|_1} = \mathop {\max }\limits_{1 \le j \le n} \sum\limits_{i = 1}^m {\left| {{a_{ij}}} \right|} $
Trường hợp\(p = \infty \), chuẩn toán tử trở thành chuẩn cực đại tổng theo dòng
${\left\| A \right\|_\infty } = \mathop {\max }\limits_{1 \le i \le m} \sum\limits_{j = 1}^n {\left| {{a_{ij}}} \right|} $
Trường hợp \(p = 2\)
\({\left\| A \right\|_2} \le {\left( {\sum\limits_{i = 1}^k {\sum\limits_{j = 1}^n | } {a_{ij}}{|^2}} \right)^{1/2}} = {\left\| A \right\|_F}\)
Trường hợp đặc biệt $p=2$ và \(m = n\)là dạng chuẩn Euclidean (Euclidean Norm) của ma trận còn gọi là chuẩn phổ (spectral norm). Spectral norm của ma trận là giá trị lớn nhất trong các giá trị kỳ dị/đơn của nó hay bằng căn bậc 2 của giá trị riêng (eigenvalue) lớn nhất của ma trận \({A^*}A\) trong đó \({A^*}\)là ma trận liên hợp chuyển vị của A (conjugate transpose).
\({\left\| A \right\|_2} = \mathop {\sup }\limits_{x \ne 0} \frac{{{{\left\| {Ax} \right\|}_2}}}{{{{\left\| x \right\|}_2}}} = \sqrt {{\lambda _{\max }}({A^*}A)}  = {\sigma _{\max }}(A)\)
Chứng minh (xem SVD)

“Entrywise” norm/“Element-wise” norm (chuẩn theo phần tử)


Áp dụng chuẩn p của vector đối với từng phần tử của ma trận khi xem ma trận như một vector kích thước m×n.
${\left\| A \right\|_p} = {(\sum\limits_{i = 1}^m {\sum\limits_{j = 1}^n {{{\left| {{a_{ij}}} \right|}^p}} } )^{1/p}}$
Mặc dù có cùng một ký hiệu như chuẩn này khác với chuẩn p-norm ở trên và Schatten p-norm.
Với \(p = 2\), chuẩn trên gọi là chuẩn Frobenius (còn gọi là chuẩn Hilbert–Schmidt) hay chuẩn F và với \(p = \infty \)là chuẩn cực đại.
Frobenius Norm
${\left\| A \right\|_F} = {(\sum\limits_{i = 1}^m {\sum\limits_{j = 1}^n {{{\left| {{a_{ij}}} \right|}^2}} } )^{1/2}} = \sqrt {tr({A^*}A)}  = \sqrt {\sum\nolimits_{i = 1}^{\min \{ m,n\} } {\sigma _i^2} } $
Chứng minh (xem SVD)
Frobenius norm bằng căn bậc hai của vết (matrix trace) ma trận \(A{A^*}\)với \({A^*}\)là liên hợp chuyển vị (conjugate transpose) của ma trận A.
Ký hiệu \(\bar A\)là ma trận liên hợp của A. Hai toán tử chuyển vị và liên hợp có thể giao hoán (commutable) nhau nên\({A^*} \equiv {\bar A^T} = \overline {{A^T}} \).
Ký hiệu \({\sigma _i}\)là các giá trị kỳ dị/đơn (singular values) của ma trận A.

Schatten norm (chuẩn Schatten)


Chuẩn p Schatten có được bằng các áp dụng chuẩn vector cho vector tạo thành bởi các giá trị kỳ dị/đơn (singular values) của ma trận. Nếu các giá trị kỳ dị ký hiệu là $\sigma_i$ thì công thức chuẩn p Schatten như sau:
${\left\| A \right\|_p} = {\left( {\sum\nolimits_{i = 1}^{\min \{ m,n\} } {{\sigma _i}^p} } \right)^{1/p}}$
Trường hợp với \(p = 2\) chuẩn Schatten cũng chính là chuẩn Frobenius.
Với $p=\infty$ chuẩn \(\infty \) Schatten là chuẩn 2 toán tử

Invertible matrix (ma trận khả nghịch)


Một ma trận vuông A n×n gọi là khả nghịch (invertible) hay không suy biến (non-singular or non-degenerate) nếu tồn tại một ma trận vuông B sao cho:
\(AB = BA = {I_n}\)
Nếu tồn tại B thì B là duy nhất và được xác định bởi A ký hiệu là\({A^{ - 1}}\)gọi là ma trận nghịch đảo của A. Một ma trận vuông không khả nghịch được gọi là ma trận kỳ dị/đặc biệt/đơn (singular) hay ma trận suy biến/thoái hóa (degenerate).
Một ma trận không phải ma trận vuông thì không khả nghịch nhưng có thể có nghịch đảo trái hoặc nghịch đảo phải ví dụ ma trận A m×n với m ≠ n có nghịch đảo phải B nxm khi \(AB = {I_m}\)
§  Phần lớn các trường hợp xét ma trận trên số thực hoặc số phức (trên một trường F) thì A là khả nghịch khi và chỉ khi định thức của nó khác 0.
§  Ma trận đơn vị là ma trận khả nghịch.
§  Nếu A, B là các ma trận khả nghịch thì AB khả nghịch và\({(AB)^{ - 1}} = {B^{ - 1}}{A^{ - 1}}\)

Tính ma trận nghịch đảo theo adjugate matrix


\({A^{ - 1}} = \frac{1}{{{\rm{det}}\left( A \right)}}\left[ {\begin{array}{*{20}{c}}{{{\rm{A}}_{11}}}&{{{\rm{A}}_{21}}}& \cdots &{{{\rm{A}}_{{\rm{n}}1}}\;}\\{{{\rm{A}}_{12}}}&{{{\rm{A}}_{22}}}& \cdots &{{{\rm{A}}_{{\rm{n}}2}}}\\ \vdots & \vdots & \ddots & \vdots \\{{{\rm{A}}_{1{\rm{n}}}}}&{{{\rm{A}}_{2{\rm{n}}}}}& \cdots &{{{\rm{A}}_{{\rm{nn}}}}}\end{array}} \right] = \frac{1}{{{\rm{det}}\left( A \right)}}adj(A)\)
Các bước tìm ma trận nghịch đảo:
§  Tính định thức nếu \(det(A) = 0\) không khả nghịch, \(det(A) \ne 0\) khả nghịch
§  Lập ma trận phụ/liên hợp (adjugate matrix) của: \(adj(A)\)
§  Tính ma trận nghịch đảo bằng công thức
Ví dụ:
\(A = \left[ {\begin{array}{*{20}{c}}1&{ - 2}&0\\3&2&1\\0&1&2\end{array}} \right]\)
Định thức (WolframAlpha determinant {{1,-2,0},{3,2,1},{0,1,2}}):
\(\det \left( A \right) = \left( 1 \right)\left| {\begin{array}{*{20}{c}}2&1\\1&2\end{array}} \right| - \left( 3 \right)\left| {\begin{array}{*{20}{c}}{ - 2}&0\\1&2\end{array}} \right| + \left( 0 \right)\left| {\begin{array}{*{20}{c}}{ - 2}&0\\2&1\end{array}} \right| = 1\left( 3 \right) - 3\left( { - 4} \right) = 15\)
Ma trận phụ/liên hợp (WolframAlpha adjugate {{1,-2,0},{3,2,1},{0,1,2}}):
\(adj\left( A \right) = \left[ {\begin{array}{*{20}{c}}3&4&{ - 2}\\{ - 6}&2&{ - 1}\\3&{ - 1}&8\end{array}} \right]\)
Ma trận nghịch đảo (WolframAlpha inverse {{1,-2,0},{3,2,1},{0,1,2}}):

\({A^{ - 1}} = \frac{1}{{15}}\left[ {\begin{array}{*{20}{c}}3&4&{ - 2}\\{ - 6}&2&{ - 1}\\3&{ - 1}&8\end{array}} \right]\)

Determinant (định thức ma trận)


Định thức ma trận (công thức xác định) là một hàm cho/của ma trận vuông trả về một số (vô hướng). Định thức của ma trận A được viết là \(\left| A \right|\)hay det(A). Nếu A chỉ chứa một phần tử 1x1 là a thì\(\left| A \right| = a\). Nếu A là ma trận 2x2 công thức tính định thức của A:
\(\det \left( A \right) = \left| A \right| = \left| {\begin{array}{*{20}{c}}a&b\\c&d\end{array}} \right| = ad - bc\) (chéo chính trừ chéo phụ)
\(\left| A \right| = \left| {\begin{array}{*{20}{c}}4&1\\1&2\end{array}} \right| = 4\left( 2 \right) - 1\left( 1 \right)\)
Nếu A là ma trận 3x3
\(\left| A \right| = \left| {\begin{array}{*{20}{c}}a&b&c\\d&e&f\\g&h&i\end{array}} \right| = a\left| {\begin{array}{*{20}{c}}e&f\\h&i\end{array}} \right| - b\left| {\begin{array}{*{20}{c}}d&f\\g&i\end{array}} \right| + c\left| {\begin{array}{*{20}{c}}d&e\\g&h\end{array}} \right| = aei + bfg + dhc - ceg - bdi - fha\)
Công thức tổng quát liên quan đến khái niệm dấu của hoán vị (permutation). Định thức của ma trận vuông cấp n là tổng đại số của n! (n giai thừa) số hạng, mỗi số hạng là tích của n phần tử lấy trên các hàng và các cột khác nhau của ma trận A, mỗi tích được nhân với phần tử dấu là +1 hoặc -1 theo phép thế tạo bởi các chỉ số hàng và chỉ số cột của các phần tử trong tích. Gọi \({S_n}\) là tập hợp các hoán vị của n phần tử 1,2,...,n. Công thức tính định thức Leibniz (Leibniz formula hay Laplace formula).
\(\left| A \right| = \sum\limits_{\sigma  \in {S_n}} s gn\left( \sigma  \right)\prod\limits_{i = 1}^n {{a_{i,{\sigma _i}}}} \)
Mỗi hoán vị là một sắp xếp thứ tự của các phần tử trong tập hợp. Các giá trị ở vị trí thứ i sau khi sắp xếp được ký hiệu là \({\sigma _i}\). Ví dụ với n = 3 dãy số 1, 2, 3 có thể được sắp xếp \(\sigma  = \left[ {2,3,1} \right],{\sigma _1} = 2,{\sigma _2} = 3,{\sigma _3} = 1\). Với mỗi \(\sigma \) ký hiệu \(sgn\left( \sigma  \right)\) thể hiện dấu của \(\sigma \) và có giá trị +1 khi việc sắp xếp thứ tực của \(\sigma \) có thể đạt được bằng một số chẵn lần hoán đổi hai phần tử và -1 nếu hóa đổi một số lẻ lần.
\(\left| A \right| = \sum\limits_{\sigma  \in {S_n}} s gn\left( \sigma  \right)\prod\limits_{i = 1}^n {{a_{i,{\sigma _i}}}} \)
\( = sgn\left( {\left[ {1,2,3} \right]} \right)\prod\limits_{i = 1}^n {{a_{i,{{\left[ {1,2,3} \right]}_i}}}}  + sgn\left( {\left[ {1,3,2} \right]} \right)\prod\limits_{i = 1}^n {{a_{i,{{\left[ {1,3,2} \right]}_i}}}} \)\( + sgn\left( {\left[ {2,1,3} \right]} \right)\prod\limits_{i = 1}^n {{a_{i,{{\left[ {2,1,3} \right]}_i}}}}  + sgn\left( {\left[ {2,3,1} \right]} \right)\prod\limits_{i = 1}^n {{a_{i,{{\left[ {2,3,1} \right]}_i}}}} \)\( + sgn\left( {\left[ {3,1,2} \right]} \right)\prod\limits_{i = 1}^n {{a_{i,{{\left[ {3,1,2} \right]}_i}}}}  + sgn\left( {\left[ {3,2,1} \right]} \right)\prod\limits_{i = 1}^n {{a_{i,{{\left[ {3,2,1} \right]}_i}}}} \)
\( = \prod\limits_{i = 1}^n {{a_{i,{{\left[ {1,2,3} \right]}_i}}}}  - \prod\limits_{i = 1}^n {{a_{i,{{\left[ {1,3,2} \right]}_i}}}} \)\( - \prod\limits_{i = 1}^n {{a_{i,{{\left[ {2,1,3} \right]}_i}}}}  + \prod\limits_{i = 1}^n {{a_{i,{{\left[ {2,3,1} \right]}_i}}}} \)\( + \prod\limits_{i = 1}^n {{a_{i,{{\left[ {3,1,2} \right]}_i}}}}  - \prod\limits_{i = 1}^n {{a_{i,{{\left[ {3,2,1} \right]}_i}}}} \)
\( = {a_{11}}{a_{22}}{a_{33}} - {a_{11}}{a_{23}}{a_{32}} - {a_{12}}{a_{21}}{a_{31}} + {a_{12}}{a_{23}}{a_{31}} + {a_{13}}{a_{21}}{a_{32}} - {a_{13}}{a_{22}}{a_{31}}\)
Định thức của ma trận A có thể định nghĩa bằng quy nạp (định lý Laplace hay Laplace expansion/ cofactor expansion) như sau:
§  n = 1: \(A = \left[ a \right],\left| A \right| = a\)
§  n > 1: \(\left| A \right| = {\left( { - 1} \right)^{i + 1}}{a_{i1}}\left| {{A_{i1}}} \right| + {\left( { - 1} \right)^{i + 2}}{a_{i2}}\left| {{A_{i2}}} \right| + ... + {\left( { - 1} \right)^{i + j}}{a_{ij}}\left| {{A_{ij}}} \right| + ... + {\left( { - 1} \right)^{i + n}}{a_{in}}\left| {{A_{in}}} \right|\) tức tính định thức theo cách khai triển theo dòng i từ 1 đến n.
Có thể chọn dòng hoặc cột để khai triển công thức tính định thức.
Trong đó
§  \({\left( { - 1} \right)^{i + j}}\) là dấu chỉ số tương ứng phần tử dòng i, cột j
§  \({a_{ij}}\)là phần tử dòng i, cột j
§  \({A_{ij}} = \left| {{M_{ij}}} \right|\)là định thức con (minor) của ma trận \({M_{ij}}\)cấp n - 1 được lập bằng cách bỏ dòng i, cột j
§  \({\left( { - 1} \right)^{i + j}}{A_{ij}}\)là phần bù đại số của \({a_{ij}}\) hay hệ số liên hợp/hệ số kép (cofactor) bằng minor nhân với chỉ số dấu
Ví dụ: khai triển tính định thức A theo dòng
\(\left| A \right| = \left| {\begin{array}{*{20}{c}}{ - 1}&4&3\\2&6&4\\3&{ - 2}&8\end{array}} \right| = \left( { - 1} \right)\left| {\begin{array}{*{20}{c}}6&4\\{ - 2}&8\end{array}} \right| - \left( 2 \right)\left| {\begin{array}{*{20}{c}}4&3\\{ - 2}&8\end{array}} \right| + \left( 3 \right)\left| {\begin{array}{*{20}{c}}4&3\\6&4\end{array}} \right|\)
\( =  - 1[{\rm{6}}({\rm{8}}) - {\rm{4}}( - 2)] - {\rm{2}}[{\rm{4}}({\rm{8}}) - {\rm{3}}( - {\rm{2}})] + {\rm{3}}[{\rm{4}}({\rm{4}}) - {\rm{3}}({\rm{6}})] =  - 138\)
Một số tính chất:
§  \({\rm{det}}\left( {{I_n}} \right) = 1\)
§  A là ma trận vuông có ma trận chuyển vị\({A^T}\)thì \({\rm{det}}\left( {{A^T}} \right) = {\rm{det}}\left( A \right)\)
§  \({\rm{det}}\left( {{A^{ - 1}}} \right) = 1/{\rm{det}}\left( A \right) = {\rm{det}}{\left( A \right)^{ - 1}}\)
§  \(\det \left( {AB} \right) = \det \left( A \right)\det \left( B \right)\) với mọi ma trận A, B khả tích AB
§  \(\det \left( {cA} \right) = {c^n}{\rm{det}}\left( A \right)\)
§  Nếu dòng thứ i nào đó có tính chất là tổng của hai số hạng thì ta có thể tách định thức của ma trận đó thành tổng của hai định thức
§  Nếu đổi vị trí hai dòng hoặc hai cột của một định thức thì giá trị định thức sẽ đổi dấu.
§  Nếu ma trận có hai dòng hoặc hai cột tỉ lệ với nhau hoặc bằng nhau thì định thức của nó sẽ bằng 0.
§  Một định thức sẽ không thay đổi nếu ta thực hiện nhân một dòng hoặc một cột nào đó với một số khác 0 rồi cộng vào các dòng hoặc các cột khác.

Adjugate matrix (ma trận phụ/liên hợp)


Ma trận phụ/liên hợp (adjugate matrix còn gọi là adjoint) là chuyển vị của ma trận được tính bằng cách thay mỗi phần tử của ma trận ban đầu bằng giá trị cofactor ứng với phần tử đó.
Ví dụ: tìm ma trận phụ/liên hợp (WolframAlpha adjugate {{2,0,1},{3,0,0},{5,1,1}})
\(A = \left[ {\begin{array}{*{20}{c}}2&0&1\\3&0&0\\5&1&1\end{array}} \right]\)
\({A_{11}} = \left| {\begin{array}{*{20}{c}}0&0\\1&1\end{array}} \right| = 0\) \({A_{12}} =  - \left| {\begin{array}{*{20}{c}}3&0\\5&1\end{array}} \right| =  - 3\) \({A_{13}} = \left| {\begin{array}{*{20}{c}}3&0\\5&1\end{array}} \right| = 3\)
\({A_{21}} =  - \left| {\begin{array}{*{20}{c}}0&1\\1&1\end{array}} \right| = 1\) \({A_{22}} = \left| {\begin{array}{*{20}{c}}2&1\\5&1\end{array}} \right| =  - 3\) \({A_{23}} =  - \left| {\begin{array}{*{20}{c}}2&0\\5&1\end{array}} \right| =  - 2\)
\({A_{31}} = \left| {\begin{array}{*{20}{c}}0&1\\0&0\end{array}} \right| = 0\) \({A_{32}} =  - \left| {\begin{array}{*{20}{c}}2&1\\3&0\end{array}} \right| = 3\) \({A_{33}} = \left| {\begin{array}{*{20}{c}}2&0\\3&0\end{array}} \right| = 0\)

Matrix of minors

Ma trận tạo từ các định thức con
\(\left[ {\begin{array}{*{20}{c}}0&3&3\\{ - 1}&{ - 3}&2\\0&{ - 3}&0\end{array}} \right]\)

Matrix of cofactors

Kết hợp với dấu của cofactors sẽ được matrix of cofactors
\(\left[ {\begin{array}{*{20}{c}} + & - & + \\ - & + & - \\ + & - & + \end{array}} \right]\), matrix of cofactors \(\left[ {\begin{array}{*{20}{c}}0&{ - 3}&3\\1&{ - 3}&{ - 2}\\0&3&0\end{array}} \right]\)
Ma trận phụ/liên hợp là transpose của matrix of cofactors.
\(adj\left( A \right) = \left[ {\begin{array}{*{20}{c}}0&1&0\\{ - 3}&{ - 3}&3\\3&{ - 2}&0\end{array}} \right]\)

System of linear equations (hệ phương trình tuyến tính)


Hệ phương trình tuyến tính là tập hợp các phương trình tuyến tính cùng những biến số. Một hệ gồm m phương trình của n ẩn số \({x_1},{x_2},{x_3},...,{x_n}\) có dạng:
\(\left\{ {\begin{array}{*{20}{c}}{{a_{11}}{x_1} + ... + {a_{1n}}{x_n} = {b_1}}\\ \cdots \\{{a_{m1}}{x_1} + ... + {a_{mn}}{x_n} = {b_m}}\end{array}} \right.\)
trong đó: \({a_{ij}},{b_i}(i = \overline {1,m} ;j = \overline {1,n} ) \in R(C){\rm{\;}}\)\({a_{ij}}\) – hệ số (của ẩn), \({b_i}\) – hệ số tự do.
Ví dụ:
\(\left\{ {\begin{array}{*{20}{c}}{3x + 2y - z = 0}\\{2x - 2y + 4z = 0}\\{ - x + (1/2)y - z = 0}\end{array}} \right.\)gồm 3 phương trình và 3 biến số x, y, z.
Với
\(A = {({a_{ij}})_{mxn}} = \left[ {\begin{array}{*{20}{c}}{{a_{11}}}&{{a_{12}}}& \ldots &{{a_{1n}}}\\{{a_{21}}}&{{a_{22}}}& \ldots &{{a_{2n}}}\\ \vdots & \vdots & \ldots & \vdots \\{{a_{m1}}}&{{a_{m2}}}& \ldots &{{a_{mn}}}\end{array}} \right]\)
\(X = \left[ {\begin{array}{*{20}{c}}{{x_1}}\\{{x_2}}\\ \vdots \\{{x_n}}\end{array}} \right]\) và \(B = \left[ {\begin{array}{*{20}{c}}{{b_1}}\\{{b_2}}\\ \vdots \\{{b_m}}\end{array}} \right]\)
hệ phương trình trên có thể viết thành phương trình ma trận: AX = B  và được gọi là dạng ma trận của hệ phương trình. Trong đó: A – ma trận hệ số của, X – ma trận ẩn số (cột ẩn số), B – ma trận tự do (cột tự do)
Ma trận \(\bar A = [A|B]\)  được gọi là ma trận mở rộng (ma trận bổ sung)
Theo công thức của phép nhân ma trận thì: \({A_{mxn}}.{X_{nx1}} = {B_{mx1}}\)
Hệ này chỉ có 3 trường hợp xảy ra:
§  Hệ vô nghiệm
§  Hệ có duy nhất 1 nghiệm
§  Hệ có vô số nghiệm
Trong trường hợp tổng quát, hệ có nghiệm khi và chỉ khi hạng của hai ma trận \(A\) và \(\bar A\) bằng nhau
\(rank(A) = rank(\bar A)\) (Định lý Rouché–Capelli hay Kronecker Capelli, xem Rank)
Cụ thể:
§  Nếu \(r = rank(A) < rank(\bar A)\) thì hệ vô nghiệm
§  Nếu \(rank(A) = rank(\bar A) = r\)hệ có nghiệm:
o   \(rank(A) = rank(\bar A) = r = n\)hệ có nghiệm duy nhất
o   \(rank(A) = rank(\bar A) = r < n\)hệ có vô số nghiệm phụ thuộc \(n - r\) ẩn tự do
§  Không xảy ra trường hợp \(r = rank(A) > rank(\bar A)\)
Trường hợp đặc biệt số phương trình bằng số ẩn \(m = n\)và ma trận A khả nghịch (hay không suy biến\(det(A) \ne 0\)) thì hệ có nghiệm duy nhất \(x = {A^{ - 1}}B\)  (xem Cramer’s rule).
Với hệ phương trình gồm n phương trình, n ẩn số:
§  Nếu \(D = det(A) \ne 0\) thì hệ có nghiệm duy nhất
§  Với \({D_j}\) là định thức có được từ D bằng cách thay cột j của ma trận hệ số A bằng cột ma trận tự do B \(\forall j = \overline {1,n} \), nếu \(D = det(A) = 0\)và tồn tại \({D_j} \ne 0\) thì hệ vô nghiệm
§  \(D = {D_j} = 0,\forall j = \overline {1,n} \)thì hệ vô định

Homogeneous systems (hệ phương trình tuyến tính thuần nhất)


Nếu \({b_i} = 0,\forall i = \overline {1;m} \) thì hệ phương trình trở thành \(AX = {0_{mx1}}\)
\(\left\{ {\begin{array}{*{20}{c}}{{a_{11}}{x_1} + ... + {a_{1n}}{x_n} = 0}\\ \cdots \\{{a_{m1}}{x_1} + ... + {a_{mn}}{x_n} = 0}\end{array}} \right.\) gọi là hệ phương trình tuyến tính thuần nhất.
Hệ phương trình tuyến tính thuần nhất luôn có ít nhất một nghiệm gọi là nghiệm tầm thường (zero solution or trivial solution) \({x_1} = {x_2} =  \ldots  = {x_n} = 0\). Nếu hệ có ma trận không suy biến (non-singular matrix) (khi det(A)  0) thì hệ có nghiệm duy nhất.
Hệ phương trình tuyến tính thuần nhất n phương trình n ẩn có nghiệm không tầm thường khi và chỉ khi định thức của ma trận các hệ số bằng 0.

Linearly dependent/Linearly independent (phụ thuộc/độc lập tuyến tính)


Cho n vector \({X_1},{X_2},...,{X_n}\) của không gian vector V trên trường K được gọi là phụ thuộc tuyến tính nếu tồn tại các vô hướng \({c_1},{c_2},...,{c_n} \in K\) không phải tất cả đều bằng 0 sao cho:
\(\sum\limits_{i = 1}^n {{c_i}} {X_i} = 0\)
Nếu không có các vô hướng nào thỏa mãn, hệ các vector gọi là không phụ thuộc tuyến tính hay là hệ độc lập tuyến tính (linearly independent). Nếu hệ các vector phụ thuộc tuyến tính thì điều kiện được viết lại như sau:
\({c_1}\left[ {\begin{array}{*{20}{c}}{{x_{11}}}\\{{x_{21}}}\\ \vdots \\{{x_{n1}}}\end{array}} \right] + {c_2}\left[ {\begin{array}{*{20}{c}}{{x_{12}}}\\{{x_{22}}}\\ \vdots \\{{x_{n2}}}\end{array}} \right] +  \ldots  + {c_n}\left[ {\begin{array}{*{20}{c}}{{x_{1n}}}\\{{x_{2n}}}\\ \vdots \\{{x_{nn}}}\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}0\\0\\ \vdots \\0\end{array}} \right]\)
\(\left[ {\begin{array}{*{20}{c}}{{x_{11}}}&{{x_{12}}}& \ldots &{{x_{1n}}}\\{{x_{21}}}&{{x_{22}}}& \ldots &{{x_{2n}}}\\ \vdots & \vdots & \ldots & \vdots \\{{x_{n1}}}&{{x_{n2}}}& \ldots &{{x_{nn}}}\end{array}} \right]\left[ {\begin{array}{*{20}{c}}{{c_1}}\\{{c_2}}\\ \vdots \\{{c_n}}\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}0\\0\\ \vdots \\0\end{array}} \right]\)
Hệ các vector \({X_1},{X_2},...,{X_n}\) phụ thuộc tuyến tính \({c_1}{X_1} + {c_2}{X_2} + ... + {c_n}{X_n} = 0\) thì tồn tại ít nhất 1 hệ số \({c_i} \ne 0\). Giả sử đó là \({c_n} \ne 0\). Khi đó\({X_n} =  - \frac{{{c_1}}}{{{c_n}}}{X_1} - \frac{{{c_2}}}{{{c_n}}}{X_2} - ... - \frac{{{c_{n - 1}}}}{{{c_n}}}{X_{n - 1}}\)
Có nghĩa là các vector \({X_1},{X_2},...,{X_n}\) phụ thuộc tuyến tính thì tồn tại ít nhất một vector là tổ hợp tuyến tính của các vector còn lại.
Các vector\({X_1},{X_2},...,{X_n}\) độc lập tuyến tính nếu và chỉ nếu
\(\forall ({c_1},{c_2},...,{c_n}) \in {K^n},\sum\limits_{i = 1}^n {{c_i}{X_i} = 0}  \Rightarrow {c_i} = 0,\forall i = 1,...,n\)
 Nói một cách khác, phương trình \({c_1}{X_1} + {c_2}{X_2} + ... + {c_n}{X_n} = 0\)có nghiệm duy nhất là \({c_1} = {c_2} =  \ldots  = {c_n} = 0\).
Để hệ phương trình ma trận (hệ thuần nhất) có nghiệm không tầm thường thì hệ phải có định thức ma trận phải bằng 0, khi đó các vector là phụ thuộc tuyến tính và ngược lại nếu định thức ma trận khác 0 thì các vector là độc lập tuyến tính.
Ví dụ: hệ vector \(\{ {u_1} = (1,1,0);{u_2} = (0,1,1);{u_3} = (1,0,1)\} \) có độc lập tuyến tính hay không?
Do \(\left| {\begin{array}{*{20}{c}}1&1&0\\0&1&1\\1&0&1\end{array}} \right| = 2 \ne 0\) nên hệ vector đã cho là độc lập tuyến tính.

Rank (hạng của ma trận)


Các hàng/dòng của A (m×n) có thể viết dưới dạng m vector \(\{ {r_1},{r_2},...,{r_m}\} \).. Các cột của ma trận A (m×n) có thể viết theo n vector \(\{ {c_1},{c_2},...,{c_n}\} \).
Không gian dòng (row space) của ma trận A là không gian vector (vector space) được tạo bởi sự kết hợp/tổ hợp tuyến tính (linear combinations) của các vector dòng. Một kết hợp tuyến tính của các vector cột \(\{ {c_1},{c_2},...,{c_n}\} \) là bất kỳ một vector nào có thể biểu diễn dưới dạng:
\(A\left[ {\begin{array}{*{20}{c}}{{\alpha _1}}\\ \vdots \\{{\alpha _n}}\end{array}} \right] = {\alpha _1}{c_1} + ... + {\alpha _n}{c_n}\) với \(\{ {\alpha _1},{\alpha _2},...,{\alpha _n}\} \) là các số vô hướng.
Tập hợp các kết hợp/ tổ hợp tuyến tính của \(\{ {c_1},{c_2},...,{c_n}\} \) gọi là không gian cột (column space).

Submatrics (ma trận con)


Cho A là ma trận m×n, k là một số tự nhiên \(1 \le k \le \min \{ m,n\} \). Chọn k dòng và k cột bất kỳ của A, các phần tử thuộc giao của k dòng và k cột này tạo thành một ma trận vuông cấp k được gọi là ma trận con cấp k của A. Định thức của ma trận này gọi là định thức con cấp k của A.

Rank (hạng  của ma trận)


Hạng cột (column rank) của A là số chiều (dimension) không gian cột (column space) của A hay là số lớn nhất/tối đa các cột độc lập tuyến tính (linearly independent) của A. Tương tự hạng dòng (row rank) của A là số chiều không gian dòng (row space) của A hay là số lớn nhất/tối đa các dòng độc lập tuyến tính.
Hạng của ma trận A là số lớn nhất các vector hàng độc lập tuyến tính của ma trận, và cũng bằng số lớn nhất các vector cột độc lập tuyến tính của nó.
Định nghĩa khác về hạng của ma trận như sau: cho A là ma trận m×n, hạng của ma trận A, ký hiệu là rank(A) hay r(A) là một số tự nhiên r: \(1 \le r \le \min \{ m,n\} \) thỏa mãn các điều kiện sau:
1.     Tồn tại ít nhất một định thức con cấp r của A khác 0.
2.     Mọi định thức con cấp cao hơn r (nếu có) đều bằng 0.

Hay hạng của A là cấp cao nhất của các định thức con khác không của ma trận A.