2016-01-11

Linear Algebra: Linear mapping/map (ánh xạ tuyến tính)

Note lại 1 số kiến thức nền về đại số tuyến tính có liên quan đến đủ mọi thứ như SVD, PCA, optimization ... (không đầy đủ, xem thêm trong các tài liệu khác).

Linear Algebra MIT OCW

Search Results

Linear Algebra Done Right, by Sheldon Axler (Author), ISBN-13: 978-3319110790
...

Phần liên quan Matrices, Vectors, Eigenvectors & eigenvaluesBilinear form and Quadratic form

Linear mapping/map (ánh xạ tuyến tính)


Quan hệ hay liên hệ giữa các tập hợp được biểu diễn bằng ánh xạ.
Với không gian vector thì ánh xạ này cần thể hiện liên hệ của cả những phép toán toán (operator) khi giữa các không gian vector.

Đồng cấu (homomorphism)

Định nghĩa 1
Giả sử V và W là hai không gian vector trên trường K. Một ánh xạ f từ V đến W ký hiệu là \(f:V \to W\) gọi là một ánh xạ tuyến tính (linear mapping or linear transformation) hay một đồng cấu (hay cấu xạ đồng nhất homomorphism, cấu xạ-morphism mang ý nghĩa là ánh xạ bảo toàn cấu trúc structure-preserving map).

Nếu với \(\forall x,y \in V,\forall k \in K\):

1.      \(f(x + y) = f(x) + f(y)\)
2.      \(f(kx) = kf(x)\)

Khi đó \(f(x)\) được gọi là ảnh của x. Nếu \(W = V\) thì f được gọi là tự đồng cấu (endomorphism). Tự đồng cấu \(f:V \to V\) còn gọi là toán tử tuyến tính (linear operator).

Hệ quả
1.      Giả sử V và W là hai không gian vector trên trường K. Một ánh xạ f từ V đến W ký hiệu là \(f:V \to W\) gọi là một ánh xạ tuyến tính khi và chỉ khi \(f(rx + sy) = rf(x) + sf(y),\forall x,y \in V,\forall r,s \in K\)
2.      Nếu \(f:V \to W\) là một ánh xạ tuyến tính thì \(f({\vec 0_v}) = {\vec 0_W}\)
Ví dụ: \(f:{R^3} \to {R^2}\) xác định bởi \(f(({a_1},{a_2},{a_3})) = ({a_1},{a_2})\) là một đồng cấu (kiểm tra bằng định nghĩa).

Định nghĩa 2
Một ánh xạ tuyến tính (đồng cấu) được gọi là:

§  Đơn cấu (monomorphism) nếu nó là một đơn ánh (injective/injection)
§  Toàn cấu (epimorphism) nếu nó là một toàn ánh (surjective/surjection)
§  Đẳng cấu (isomorphism) nếu nó đồng thời là đơn ánh và toàn ánh (hay song ánh-bijective/bijection).
§  Tự đẳng cấu (automorphism) nếu là vừa là tự đồng cấu và đẳng cấu

Khi có một đẳng cấu từ không gian vector V sang W ký hiệu \(f:V \cong W\) thì V, W được gọi là đẳng cấu với nhau.

Ánh xạ tuyến tính \(f:V \to W\) là một đẳng cấu khi và chỉ khi tồn tại một ánh xạ tuyến tính \({f^{ - 1}}:W \to V\) sao cho \({f^{ - 1}}f = {1_V},f{f^{ - 1}} = {1_W}\).

Chứng minh: nếu f là một đẳng cấu thì tồn tại một ánh xạ ngược \({f^{ - 1}}\), dùng điều kiện chứng minh \({f^{ - 1}}\) là một ánh xạ tuyến tính theo định nghĩa. Ngược lại nếu tồn tại một ánh xạ tuyến tính \({f^{ - 1}}:W \to V\) sao cho \({f^{ - 1}}f = {1_V},f{f^{ - 1}} = {1_W}\) thì f là một song ánh, theo định nghĩa f là đẳng cấu.
Ví dụ: \(f:{R^3} \to {R^2}\) xác định bởi \(f(({a_1},{a_2},{a_3})) = ({a_1},{a_2})\) là một toàn cấu bởi vì \(\forall \beta ({a_1},{a_2}) \in {R^2}\) đều \(\exists \alpha ({a_1},{a_2},0) \in {R^3}\) sao cho \(f(\alpha ) = \beta \).

Sự xác định của một ánh xạ tuyến tính

Định lý
Giả sử V và W là hai không gian vector trên trường K, \(\beta  = \{ {b_1},...,{b_n}\} \) là một cơ sở của V và \({x_1}, \ldots ,{x_n}\) là n vector tùy ý của W. Khi đó tồn tại duy nhất một ánh xạ tuyến tính \(f:V \to W\) sao cho \(f({b_i}) = {x_i},\forall i = \overline {1,n} \).
Với \(u = {r_1}{b_1} + {r_2}{b_2} + ... + {r_n}{b_n}\) chọn f xác định như sau \(f(u) = {r_1}{x_1} + {r_2}{x_2} + ... + {r_n}{x_n} \in W\). Do \(\beta  = \{ {b_1},...,{b_n}\} \) là cơ sở của V nên \(u,{r_i},n\) được xác định duy nhất hay \(f(u)\) xác định duy nhất, do đó f là một ánh xạ.


Chứng minh f là một ánh xạ tuyến tính.
Với \(u = {r_1}{b_1} + {r_2}{b_2} + ... + {r_n}{b_n},v = {s_1}{b_1} + {s_2}{b_2} + ... + {s_n}{b_n} \in V,\forall k \in K\):
\(\begin{array}{l}u + v = ({r_1} + {s_1}){b_1} + ({r_2} + {s_2}){b_2} + ... + ({r_n} + {s_n}){b_n}\\ku = k{r_1}{b_1} + k{r_2}{b_2} + ... + k{r_n}{b_n}\end{array}\)

Theo định nghĩa của f:
\(\begin{array}{l}f(u + v) = ({r_1} + {s_1}){x_1} + ({r_2} + {s_2}){x_2} + ... + ({r_n} + {s_n}){x_n} = f(u) + f(v)\\f(ku) = k{r_1}{x_1} + k{r_2}{x_2} + ... + k{r_n}{x_n} = kf(u)\end{array}\)
Hơn nữa có thể viết \({b_i} = 0{b_1} + 0{b_2} + ... + {b_i} + ... + 0{b_n},\forall {b_i} \Rightarrow f({b_i}) = {x_i}\) .

Để kiểm tra tính duy nhất của f, giả sử tồn tại một ánh xạ tuyến tính \(f\prime :V \to W\) thỏa mãn điều kiện \(f\prime ({b_i}) = {x_i},\forall i = \overline {1,n} \). Do \(f\prime :V \to W\) là ánh xạ tuyến tính nên theo tính chất ánh xạ tuyến tính:
\(\begin{array}{l}f\prime (u) = f\prime ({r_1}{b_1} + {r_2}{b_2} + ... + {r_n}{b_n}) = {r_1}f\prime ({b_1}) + {r_2}f\prime ({b_2}) + ... + {r_n}f\prime ({b_n})\\ = {r_1}{x_1} + {r_2}{x_2} + ... + {r_n}{x_n} = f(u)\end{array}\)

Do đó \(f\prime  = f\) hay f là duy nhất.

Kết luận
§  Để xác định ánh xạ tuyến tính \(f:V \to W\) chỉ cần xác định ảnh của các vector cơ sở.
§  Mỗi hệ n vector của W xác định một ánh xạ tuyến tính từ V đến W nếu \(W \ne 0\).

Hạt nhân/Nhân và ảnh của ánh xạ tuyến tính (Kernel & image)

Định nghĩa
Giả sử V, W là hai không gian vector trên trường K, \(f:V \to W\) là một ánh xạ tuyến tính, \(A \subseteq V,B \subseteq W\) là các không gian con.

Ảnh của A, hay tập hợp ảnh của A (image) ký hiệu \(Im(A)\) xác định:
\(f(A) = \{ \beta  = f(\alpha ) \in W\left| {\alpha  \in A} \right.\} \) là tập hợp các ảnh của mọi vector \(\forall \alpha  \in A\) tạo do đồng cấu f.
Tập hợp \({f^{ - 1}}(B) = \{ \alpha  \in V\left| {f(\alpha ) \in B} \right.\} \) được gọi là tạo ảnh (ảnh ngược-preimage hay inverse image) của B.
Tập hợp f(V) gọi là ảnh của V hay còn gọi là ảnh của f \(Im(f)\).
Tập hợp \({f^{ - 1}}({\overrightarrow 0 _W})\) được gọi là hạt nhân của f và ký hiệu là \(Ker(f)\).

Định lý
Giả sử V, W là hai không gian vector trên trường K, \(f:V \to W\) là một ánh xạ tuyến tính, \(A \subseteq V,B \subseteq W\) là các không gian con. Khi đó:

1.      \(f(A)\) là một không gian con của W. Nếu hệ vector \(\{ {\varepsilon _1},{\varepsilon _2},...,{\varepsilon _n}\} \) là một hệ sinh của A thì hệ vector \(\{ f({\varepsilon _1}),f({\varepsilon _2}),...,f({\varepsilon _n})\} \) là một hệ sinh của \(f(A)\).
2.      \({f^{ - 1}}(B)\) là một không gian con của V.

Chứng minh:
Vì \({\overrightarrow 0 _V} \in A\) nên \(f({\overrightarrow 0 _V}) \in f(A)\) hay \(f(A) \ne \emptyset \) (1).

Giả sử \({\beta _1},{\beta _2} \in f(A);r,s \in K\), theo định nghĩa của \(f(A)\) là tập ảnh của A, tồn tại \({\alpha _1},{\alpha _2} \in A\) sao cho \(f({\alpha _1}) = {\beta _1},f({\alpha _2}) = {\beta _2}\).
Vì f là một ánh xạ tuyến tính nên \(r{\beta _1} + s{\beta _2} = rf({\alpha _1}) + sf({\alpha _2}) = f(r{\alpha _1}) + f(s{\alpha _2}) = f(r{\alpha _1} + s{\alpha _2})\). Do A là một không gian con của V nên theo tính chất không gian vector \(r{\alpha _1} + s{\alpha _2} \in A\), vì vậy \(r{\beta _1} + s{\beta _2} = f(r{\alpha _1} + s{\alpha _2}) \in f(A)\) (2).
Từ (1), (2) \(f(A) \subseteq W\).

Giả sử \(\{ {e_1},{e_2},...,{e_n}\} \) là một hệ sinh của A khi đó \(f({e_i}) \in f(A)\). Do \(\alpha \) là tổ hợp tuyến tính của hệ vector \(\{ {e_1},{e_2},...,{e_n}\} \) nên \(\alpha  = {x_1}{e_1} + {x_2}{e_2} +  \ldots  + {x_n}{e_n},f(\alpha ) = \beta \):
\(\beta  = f(\alpha ) = f({x_1}{e_1} + {x_2}{e_2} +  \ldots  + {x_n}{e_n}) = {x_1}f({e_1}) + {x_2}f({e_2}) +  \ldots  + {x_n}f({e_n})\)

Do đó hệ \(\{ f({e_1}),f({e_2}),...,f({e_n})\} \) là một hệ sinh của \(f(A)\).
Chứng minh tương tự \({f^{ - 1}}(B) \subseteq V\).

Hệ quả
Giả sử V, W là hai không gian vector trên trường K, \(f:V \to W\) là một ánh xạ tuyến tính

§  \(Im(f)\) là không gian con của W
§  \(Ker(f)\) là không gian con của V
§  f là một toàn cấu khi \(Im(f) = W\)
§  f là một đơn cấu khi và chỉ khi (iff), \(Ker(f) = {\overrightarrow 0 _V}\)

Giả sử f là một đơn cấu và \(\alpha  \in Ker(f)\), khi đó \(f(\alpha ) = {\overrightarrow 0 _W} = f({\overrightarrow 0 _V})\). Vì f là đơn cấu nên \(\alpha  = {\overrightarrow 0 _V}\) hay \(Ker(f) = \{ {\overrightarrow 0 _V}\} \)

Ngược lại nếu \(Ker(f) = \{ {\overrightarrow 0 _V}\} \), khi \(f({\alpha _1}) = f({\alpha _2})\) với \({\alpha _1},{\alpha _2} \in V\).
Xét \(f({\alpha _1} - {\alpha _2}) = f({\alpha _1}) - f({\alpha _2}) = {\overrightarrow 0 _W}\) do vậy \({\alpha _1} - {\alpha _2} \in Ker(f)\) hay \({\alpha _1} - {\alpha _2} = {\overrightarrow 0 _V} \Rightarrow {\alpha _1} = {\alpha _2}\).

Đẳng cấu giữa hai không gian cùng số chiều

Định lý
Hai không gian vector trên trường K đẳng cấu khi và chỉ khi có cùng số chiều.
Giả sử \(f:V \cong W\) là một đẳng cấu. Khi đó f đồng thời là một đơn cấu và toàn cấu.
Do đó \(Ker(f) = \overrightarrow 0 ,Im(f) = W\), khi đó
\(dim(V) = dim(W) + dim(Ker(f)) = dim(W) + 0 = \dim (W)\)

Ngược lại:
Giả sử \(\beta  = \{ {b_1},{b_2},...,{b_n}\} \) là cơ sở của V và \(\gamma  = \{ {g_1},{g_2},...,{g_n}\} \) là một cơ sở của W có cùng số chiều là n. Do đó có một ánh xạ tuyến tính \(f:V \to W\) sao cho \(f({b_i}) = {g_i},i = \overline {1,n} \). Khi đó hệ \(\gamma  = \{ {g_1},{g_2},...,{g_n}\} \) cũng là hệ sinh của \(Im(f)\) nên \(Im(f) = W\) nên f là toàn cấu.
Hơn nữa \(dim(Ker(f)) = dim(V) - dim(Im(f)) = 0\) nên f là một đơn cấu.

Kết luận f là một đẳng cấu nên V và W đẳng cấu với nhau.

Hệ quả 1
Giả sử V, W là hai không gian vector trên trường K, ánh xạ tuyến tính \(f:V \to W\) là một đẳng cấu khi và chỉ khi nó biến một cơ sở của V thành một cơ sở của W.

Hệ quả 2
Giả sử \(f:V \to V\) là toán tử tuyến tính, khi đó các mệnh đề sau tương đương:
1.      f đẳng cấu
2.      Tồn tại ánh xạ ngược \({f^{ - 1}}\)
3.      f đơn cấu
4.      f toàn cấu

Tọa độ biểu diễn vector (Coordinate representation of vector)

Định nghĩa
Nếu \(\beta  = \{ {b_1},...,{b_n}\} \) là một cở sở của không gian vector V trên trường K. Khi đó, \(\forall v \in V\) tồn tại duy nhất một bộ vô hướng \({a_1},{a_2}, \ldots ,{a_n} \in K\) sao cho:
\(v = {a_1}{b_1} + {a_2}{b_2} + ... + {a_n}{b_n}\)

Khi đó tọa độ (coordinate vector hay \(\beta \)– coordinates) của vector v đối với cơ sở \(\beta \) (to the ordered basic) được định nghĩa là vector cột (column vector) thuộc \({K^n}\) chứa các vô hướng \({a_i}\), ký hiệu:

\({\left[ v \right]_\beta } = \left[ {\begin{array}{*{20}{c}}{{a_1}}\\ \vdots \\{{a_n}}\end{array}} \right]\)

Khi đó vector V viết lại như sau:

\(v = {a_1}{b_1} + {a_2}{b_2} + ... + {a_n}{b_n} = \left[ {\begin{array}{*{20}{c}}{{b_1}}& \ldots &{{b_n}}\end{array}} \right]\left[ {\begin{array}{*{20}{c}}{{a_1}}\\ \vdots \\{{a_n}}\end{array}} \right] = B{\left[ v \right]_\beta }\)

Ánh xạ tọa độ (Coordinate mapping- coordinate isomorphism)
Nếu \(\beta  = \{ {b_1},...,{b_n}\} \) là một cơ sở của không gian vector V trên trường K. Khi đó tồn tại ánh xạ gọi là ánh xạ tọa độ (coordinate map) còn gọi là biểu diễn chuẩn (standard representation) của V đối với cơ sở \(\beta  = \{ {b_1},...,{b_n}\} \) từ V tới \({K^n}\) (hay còn ký hiệu là \({V_n}\)) ký hiệu \({\phi _\beta }:V \to {K^n}\) xác định bởi:

\({\phi _\beta }(v) = {\left[ v \right]_\beta }\)
\({\phi _\beta }:V \to {K^n}\) cũng là một ánh xạ tuyến tính (linear map hay linear transformation) hơn nữa nó còn là một đẳng cấu (isomorphism).

Chứng minh:

Để chứng minh \({\phi _\beta }\) là một đẳng cấu trước tiên phải chứng minh \({\phi _\beta }\) là một ánh xạ tuyến tính. Giả sử \(\forall x,y \in V\) do \(\beta  = \{ {b_1},...,{b_n}\} \) là cơ sở của V nên x, y có thể biểu diễn theo cơ sở này:

\(\begin{array}{l}x = {x_1}{b_1} + {x_2}{b_2} + ... + {x_n}{b_n}\\y = {y_1}{b_1} + {y_2}{b_2} + ... + {y_n}{b_n}\end{array}\)

Xét: \(x + y = ({x_1} + {y_1}){b_1} + ({x_2} + {y_2}){b_2} + ... + ({x_n} + {y_n}){b_n}\)
Và \(\forall k \in K\): \(kx = k{x_1}{b_1} + k{x_2}{b_2} + ... + k{x_n}{b_n}\)
\({\phi _\beta }(x + y) = {\left[ {x + y} \right]_\beta } = \left[ {\begin{array}{*{20}{c}}{{x_1} + {y_1}}\\ \vdots \\{{x_n} + {y_n}}\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}{{x_1}}\\ \vdots \\{{x_n}}\end{array}} \right] + \left[ {\begin{array}{*{20}{c}}{{y_1}}\\ \vdots \\{{y_n}}\end{array}} \right] = {\left[ x \right]_\beta } + {\left[ y \right]_\beta } = {\phi _\beta }(x) + {\phi _\beta }(y)\)


\({\phi _\beta }(kx) = {\left[ {kx} \right]_\beta } = \left[ {\begin{array}{*{20}{c}}{k{x_1}}\\ \vdots \\{k{x_n}}\end{array}} \right] = k\left[ {\begin{array}{*{20}{c}}{{x_1}}\\ \vdots \\{{x_n}}\end{array}} \right] = k{\left[ x \right]_\beta } = k{\phi _\beta }(x)\)

Do đó \({\phi _\beta }:V \to {K^n}\) là một ánh xạ tuyến tính.

Chứng minh ánh xạ tuyến tính \({\phi _\beta }\) là một đẳng cấu
Giả sử \(x,y \in V\) và \({\phi _\beta }(x) = {\phi _\beta }(y)\), khi đó \({\left[ x \right]_\beta } = {\left[ y \right]_\beta }\). Do dạng biểu diễn theo cơ sở \(\beta \) của một vector là duy nhất nên \(x = y\) hay \({\phi _\beta }\) là một đơn ánh.

Giả sử bất kỳ \({\left[ x \right]_\beta } = \left[ {\begin{array}{*{20}{c}}{{x_1}}\\ \vdots \\{{x_n}}\end{array}} \right] \in {K^n}\)

Xét \(x = {x_1}{b_1} + {x_2}{b_2} + ... + {x_n}{b_n} \in V\) thì \({\phi _\beta }(x) = {\left[ x \right]_\beta }\). Như vậy tất cả các phần tử của \({K^n}\) đều có tạo ảnh. Do đó \({\phi _\beta }\) là một toàn ánh.

Chuyển đổi tọa độ (Changing between coordinates with respect to two different bases)
Tổng quát cho không gian vector V trên trường K. Giả sử \(\beta  = \{ {b_1},...,{b_n}\} \), \(\gamma  = \{ {g_1},...,{g_n}\} \) là các cơ sở của V. Khi đó với \(\forall v \in V\): \({\left[ v \right]_\gamma } = {P_{\gamma  \leftarrow \beta }}{\left[ v \right]_\beta }\) với \({P_{\gamma  \leftarrow \beta }}\) là ma trận n×n gọi là ma trận chuyển đổi (cơ sở) (transition matrix) từ \(\beta \) sang \(\gamma \) tạo thành từ các vector cột là tọa độ của \({b_1},...,{b_n}\) theo cơ sở \(\gamma \).

Chứng minh:

Giả sử \(v = {x_1}{b_1} + ... + {x_n}{b_n}\) hay \({\left[ v \right]_\beta } = \left[ {\begin{array}{*{20}{c}}{{x_1}}\\ \vdots \\{{x_n}}\end{array}} \right]\)
Gọi các ánh xạ tọa độ tương ứng là \({\phi _\beta },{\phi _\gamma }:V \to {K^n}\)

Do \({\phi _\gamma }\) là ánh xạ tuyến tính nên:

\(\begin{array}{l}{\left[ v \right]_\gamma } = {\phi _\gamma }(v) = {\phi _\gamma }({x_1}{b_1} + ... + {x_n}{b_n}) = {\phi _\gamma }({x_1}{b_1}) + ... + {\phi _\gamma }({x_n}{b_n})\\ = {x_1}{\phi _\gamma }({b_1}) + ... + {x_n}{\phi _\gamma }({b_n}) = {x_1}{\left[ {{b_1}} \right]_\gamma } + ... + {x_n}{\left[ {{b_n}} \right]_\gamma } = \\ = \left[ {\begin{array}{*{20}{c}}{\left. {{{\left[ {{b_1}} \right]}_\gamma }} \right|}& \cdots &{\left| {{{\left[ {{b_n}} \right]}_\gamma }} \right.}\end{array}} \right]\left[ {\begin{array}{*{20}{c}}{{x_1}}\\ \vdots \\{{x_n}}\end{array}} \right] = {P_{\gamma  \leftarrow \beta }}{\left[ v \right]_\beta }\end{array}\)

Tổng quát với  \(\alpha ,\beta ,\gamma \) là cơ sở của V:

1.      \({P_{\alpha  \leftarrow \alpha }} = {I_n}\)
2.      \({P_{\alpha  \leftarrow \gamma }} = {P_{\alpha  \leftarrow \beta }}{P_{\beta  \leftarrow \gamma }}\)
3.      \({P_{\alpha  \leftarrow \beta }} = {({P_{\beta  \leftarrow \alpha }})^{ - 1}}\)

Chứng minh (2)
Với \(\forall v \in V\) theo định nghĩa:
\({P_{\alpha  \leftarrow \gamma }}{\left[ v \right]_\gamma } = {\left[ v \right]_\alpha } = {P_{\alpha  \leftarrow \beta }}{\left[ v \right]_\beta } = {P_{\alpha  \leftarrow \beta }}({P_{\beta  \leftarrow \gamma }}{\left[ v \right]_\gamma })\)
Theo tính chất phép nhân ma trận

\({P_{\alpha  \leftarrow \gamma }}{\left[ v \right]_\gamma } = {\left[ v \right]_\alpha } = {P_{\alpha  \leftarrow \beta }}{\left[ v \right]_\beta } = {P_{\alpha  \leftarrow \beta }}({P_{\beta  \leftarrow \gamma }}{\left[ v \right]_\gamma }) = ({P_{\alpha  \leftarrow \beta }}{P_{\beta  \leftarrow \gamma }}){\left[ v \right]_\gamma },\forall v \in V\)
Do đó  \({P_{\alpha  \leftarrow \gamma }} = {P_{\alpha  \leftarrow \beta }}{P_{\beta  \leftarrow \gamma }}\)

Chứng minh (3)
Theo (2) với \(\gamma  = \alpha \) có \({P_{\alpha  \leftarrow \gamma }} = {P_{\alpha  \leftarrow \beta }}{P_{\beta  \leftarrow \gamma }} \Leftrightarrow {P_{\alpha  \leftarrow \alpha }} = {P_{\alpha  \leftarrow \beta }}{P_{\beta  \leftarrow \alpha }} \Leftrightarrow {I_n} = {P_{\alpha  \leftarrow \beta }}{P_{\beta  \leftarrow \alpha }}\)

Ý nghĩa


Ánh xạ hợp \({\phi _\gamma } \circ {\phi _\beta }^{ - 1}:{K^n} \to {K^n}\) là một ánh xạ tuyến tính từ \({K^n}\) tới chính nó biểu diễn bởi: \(x \mapsto {P_{\gamma  \leftarrow \beta }}x\), trong đó \({P_{\gamma  \leftarrow \beta }}\) là ma trận n×n gọi là ma trận chuyển đổi (cơ sở) (transition matrix) từ \(\beta \) sang \(\gamma \) .

Chứng minh: dùng tính chất phép nhân ma trận.

Ma trận biểu diễn ánh xạ tuyến tính (Matrix representation of linear map)

Định nghĩa
Giả sử V và W là hai không gian vector trên trường K, \(\beta  = ({b_1},...,{b_n})\) là một cơ sở của V và \(\gamma  = ({g_1}, \ldots ,{g_m})\) là một cơ sở của W, \(f:V \to W\) là một ánh xạ tuyến tính từ V đến W.

Do các vector \({b_j} \in V \Rightarrow f({b_j}) \in W,j = \overline {1,n} \), mặc khác \(\gamma  = ({g_1}, \ldots ,{g_m})\) là một cơ sở của W nên \(f({b_j})\) có thể biểu diễn theo cơ sở \(\gamma  = ({g_1}, \ldots ,{g_m})\):

\(\begin{array}{l}f({b_j}) = {a_{1j}}{g_1} + {a_{2j}}{g_2} + ... + {a_{mj}}{g_m} = \sum\nolimits_{i = 1}^m {{a_{ij}}} {g_i},i = \overline {1,m} \\ \Rightarrow {\left[ {f({b_j})} \right]_\gamma } = \left[ {\begin{array}{*{20}{c}}{{a_{1j}}}\\ \vdots \\{{a_{mj}}}\end{array}} \right]\end{array}\)

Khi đó ma trận m×n \(A = ({a_{ij}})\) có các vector cột là tọa độ của \(f({b_j})\) trong cơ sở \(\gamma \) gọi là ma trận biểu diễn ánh xạ tuyến tính \(f:V \to W\) đối với cặp cơ sở \((\beta ,\gamma )\).

\(A = \left[ f \right]_\beta ^\gamma  = \left[ {\left. {{{\left[ {f({b_1})} \right]}_\gamma }} \right|\left. {{{\left[ {f({b_2})} \right]}_\gamma }} \right| \cdots \left| {{{\left[ {f({b_n})} \right]}_\gamma }} \right.} \right] = \left[ {\begin{array}{*{20}{c}}{{a_{11}}}& \ldots &{{a_{1n}}}\\ \vdots & \ddots & \vdots \\{{a_{m1}}}& \cdots &{{a_{mn}}}\end{array}} \right]\)

Trong trường hợp f là tự đồng cấu \(V = W\) và \(\beta  = \gamma \) có thể viết  \({\left[ f \right]_\beta }\) thay vì \(\left[ f \right]_\beta ^\beta \).

Định lý
Giả sử V và W là hai không gian vector trên trường K với cặp cơ sở \((\beta ,\gamma )\), \(f:V \to W\) là một ánh xạ tuyến tính từ V đến W, thì \(\forall u \in V\):
\({[f(u)]_\gamma } = \left[ f \right]_\beta ^\gamma {\left[ u \right]_\beta }\)

Chứng minh:

Do \(u \in V\) nên có thể biểu diễn bởi cơ sở \(\beta  = ({b_1},...,{b_n})\): \(u = \sum\nolimits_{j = 1}^n {{u_j}{b_j}} \)

Do f và \({\phi _\gamma }\) là ánh xạ tuyến tính nên theo tính chất của ánh xạ tuyến tính:
\(\begin{array}{l}f(u) = f(\sum\nolimits_{j = 1}^n {{u_j}{b_j}} ) = \sum\nolimits_{j = 1}^n {f({u_j}{b_j})}  = \sum\nolimits_{j = 1}^n {{u_j}f({b_j})} \\ \Rightarrow {\left[ {f(u)} \right]_\gamma } = {\phi _\gamma }(\sum\nolimits_{j = 1}^n {{u_j}f({b_j}))}  = \sum\nolimits_{j = 1}^n {{u_j}{\phi _\gamma }(f({b_j}))}  = {\sum\nolimits_{j = 1}^n {{u_j}\left[ {f({b_j})} \right]} _\gamma }\\ \Rightarrow {\left[ {f(u)} \right]_\gamma } = \left[ {\left. {{{\left[ {f({b_1})} \right]}_\gamma }} \right|\left. {{{\left[ {f({b_2})} \right]}_\gamma }} \right| \cdots \left| {{{\left[ {f({b_n})} \right]}_\gamma }} \right.} \right]\left[ {\begin{array}{*{20}{c}}{{u_1}}\\ \vdots \\{{u_n}}\end{array}} \right] = \left[ f \right]_\beta ^\gamma {\left[ u \right]_\beta }\end{array}\)
\({[f(u)]_\gamma } = \left[ f \right]_\beta ^\gamma {\left[ u \right]_\beta }\) còn gọi là biểu thức tọa độ của ánh xạ tuyến tính f đối với cặp cơ sở \((\beta ,\gamma )\).

Khi chỉ đề cập ánh xạ tuyến tính \(f:V \to W\) mà không chỉ định cặp cơ sở \((\beta ,\gamma )\) có nghĩa ngầm định ánh xạ được xét sử dụng cơ sở chính tắc của V, W. Ma trận trong cặp cơ sở chính tắc gọi là ma trận chính tắc.

Tổng hai ánh xạ tuyến tính (Sum of two linear maps)

Định nghĩa
Giả sử V và W là hai không gian vector trên trường K, f, g là ánh xạ tuyến tính từ V đến W \(f,g:V \to W\). Tổng của hai ánh xạ tuyến tính ký hiệu \(f + g\) được định nghĩa:
\((f + g)(x) = f(x) + g(x)\)

Ánh xạ tổng \(f + g\) của hai ánh xạ tuyến tính f và g là một ánh xạ tuyến tính.

Chứng minh:

Với \(\forall \alpha ,\beta  \in V,\forall r,s \in K\):
\(\begin{array}{l}(f + g)(r\alpha  + s\beta ) = f(r\alpha  + s\beta ) + g(r\alpha  + s\beta )\\ = rf(\alpha ) + sf(\beta ) + rg(\alpha ) + sg(\beta ) = r[f(\alpha ) + g(\alpha )] + s[f(\beta ) + g(\beta )]\\ = r(f + g)(\alpha ) + s(f + g)(\beta )\end{array}\)

Do đó \(f + g\) là một ánh xạ tuyến tính

Định lý
Giả sử V và W là hai không gian vector trên trường K lần lượt có cơ sở là \((\beta ,\gamma )\). Giả sử f, g là ánh xạ tuyến tính từ V đến W \(f,g:V \to W\) ứng với hai cơ sở \((\beta ,\gamma )\):
\([f + g]_\beta ^\gamma  = \left[ f \right]_\beta ^\gamma  + \left[ g \right]_\beta ^\gamma \)

Chứng minh:
Với \(f + g,{\phi _\gamma }\) là các ánh xạ tuyến tính, \(\forall u \in V\)
\(\begin{array}{l}{[(f + g)(u)]_\gamma } = {\phi _\gamma }((f + g)(u)) = {\phi _\gamma }(f(u) + g(u))\\ = {\phi _\gamma }(f(u)) + {\phi _\gamma }(g(u)) = {[f(u)]_\gamma } + {[g(u)]_\gamma }\end{array}\)

Mặc khác \({[(f + g)(u)]_\gamma } = \left[ {f + g} \right]_\beta ^\gamma {\left[ u \right]_\beta },{[f(u)]_\gamma } = \left[ f \right]_\beta ^\gamma {\left[ u \right]_\beta },{[g(u)]_\gamma } = \left[ g \right]_\beta ^\gamma {\left[ u \right]_\beta }\) nên
\(\left[ {f + g} \right]_\beta ^\gamma {\left[ u \right]_\beta } = \left[ f \right]_\beta ^\gamma {\left[ u \right]_\beta } + \left[ g \right]_\beta ^\gamma {\left[ u \right]_\beta } = (\left[ f \right]_\beta ^\gamma  + \left[ g \right]_\beta ^\gamma ){\left[ u \right]_\beta },\forall u \in V\)
\( \Rightarrow [f + g]_\beta ^\gamma  = \left[ f \right]_\beta ^\gamma  + \left[ g \right]_\beta ^\gamma \)

Tích của một ánh xạ tuyến tính với vô hướng (multiplication of linear maps with scalars)

Định nghĩa
Giả sử V và W là hai không gian vector trên trường K, f là ánh xạ tuyến tính từ V đến W \(f:V \to W\). Tích của một ánh xạ tuyến tính với vô hướng (scalar multiplication) \(k \in K\), ký hiệu \(kf\) được định nghĩa
\((kf)(x) = kf(x)\)

Với \(k =  - 1\) tích của ánh xạ f với k: \(( - 1)f\) gọi là ánh xạ đôi của f và ký hiệu là \( - f\).
Tích của một ánh xạ tuyến tính với vô hướng (scalar multiplication) là một ánh xạ tuyến tính.

Định lý
Giả sử V và W là hai không gian vector trên trường K với cặp cơ sở tương ứng là \((\beta ,\gamma )\). Giả sử f là một ánh xạ tuyến tính từ V đến W \(f:V \to W\), \(k \in K\)vô hướng (scalar multiplication).
\([kf]_\beta ^\gamma  = k\left[ f \right]_\beta ^\gamma \)

Tích của hai ánh xạ tuyến tính (multiplication of linear maps/composite of linear maps)

Định nghĩa
Giả sử V và W là hai không gian vector trên trường K, f, g là các ánh xạ tuyến tính \(f:V \to W,g:W \to U\). Tích của hai ánh xạ f và g ký hiệu là \(gf\) được xác định như sau:
\((gf)(x) = g(f(x))\)

Tích của hai ánh xạ tuyến tính cũng là một ánh xạ tuyến tính.

Chứng minh:

Với \(\forall \alpha ,\beta  \in V,\forall r,s \in K\):
\(\begin{array}{l}(gf)(r\alpha  + s\beta ) = g(f(r\alpha  + s\beta )) = g(f(r\alpha )) + g(f(s\beta ))\\ = g(rf(\alpha )) + g(sf(\beta )) = r(gf)(\alpha ) + s(gf)(\beta )\end{array}\)

Do đó \(gf\) là một ánh xạ tuyến tính.
Tích của hai ánh xạ tuyến tính còn gọi là hợp của hai ánh xạ tuyến tính (composite of two linear maps) và ký hiệu là \(g \circ f\)

Tương đương với phép nhân ma trận (Equivalence of composition and matrix multiplication)
Giả sử V, W, và Z là các không gian vector trên trường K lần lượt có các cơ sở là \(\alpha ,\beta ,\gamma \). Giả sử f, g là hai ánh xạ tuyến tính \(f:U \to V,g:V \to W\):
\([gf]_\alpha ^\gamma  = \left[ g \right]_\beta ^\gamma \left[ f \right]_\alpha ^\beta \)


Chứng minh:

Giả sử \(\alpha  = ({u_1},{u_2},...,{u_p}),\beta  = ({v_1},{v_2},...,{v_n}),\gamma  = ({w_1},{w_2},...,{w_m})\)

Do \({u_i} \in U \Rightarrow f({u_i}) \in V,i = \overline {1,p} \), ma trận chuyển đổi n×p từ \(\alpha  \to \beta \) tương ứng \(f({u_i}) = \sum\nolimits_{j = 1}^n {{a_{ji}}{v_j}} ,j = \overline {1,n} \)
\(\left[ f \right]_\alpha ^\beta  = \left[ {\begin{array}{*{20}{c}}{{a_{11}}}& \ldots &{{a_{1p}}}\\ \vdots & \ddots & \vdots \\{{a_{n1}}}& \cdots &{{a_{np}}}\end{array}} \right]\)

Tương tự do \({v_j} \in V \Rightarrow g({v_j}) \in W,j = \overline {1,n} \), ma trận chuyển đổi m×n từ \(\beta  \to \gamma \) tương ứng \(g({v_j}) = \sum\nolimits_{k = 1}^m {{b_{kj}}{w_k}} ,k = \overline {1,m} \)
\(\left[ g \right]_\beta ^\gamma  = \left[ {\begin{array}{*{20}{c}}{{b_{11}}}& \ldots &{{b_{1n}}}\\ \vdots & \ddots & \vdots \\{{b_{m1}}}& \cdots &{{b_{mn}}}\end{array}} \right]\)

Do đó \(g(f({u_i})) = g(\sum\nolimits_{j = 1}^n {{a_{ji}}{v_j}} ) = \sum\nolimits_{j = 1}^n {{a_{ji}}g({v_j})}  = \sum\nolimits_{j = 1}^n {{a_{ji}}\sum\nolimits_{k = 1}^m {{b_{kj}}{w_k}} } \)

Đổi thứ tự tính tổng \(g(f({u_i})) = \sum\nolimits_{j = 1}^n {{a_{ji}}\sum\nolimits_{k = 1}^m {{b_{kj}}{w_k}} }  = \sum\nolimits_{k = 1}^m {(\sum\nolimits_{j = 1}^n {{b_{kj}}{a_{ji}}} ){w_k}} \)

Đặt \({c_{ki}} = \sum\nolimits_{j = 1}^n {{b_{kj}}{a_{ji}}} \] khi đó: \(gf({u_i}) = g(f({u_i})) = \sum\nolimits_{k = 1}^m {{c_{ki}}{w_k}} \).

Theo định nghĩa, ma trận chuyển đổi m×p từ \(\alpha  \to \gamma \) là:
\([gf]_\alpha ^\gamma  = \left[ {\begin{array}{*{20}{c}}{{c_{11}}}& \ldots &{{c_{1p}}}\\ \vdots & \ddots & \vdots \\{{c_{m1}}}& \cdots &{{c_{mp}}}\end{array}} \right]\)

Như do \({c_{ki}} = \sum\nolimits_{j = 1}^n {{b_{kj}}{a_{ji}}} \) nên \([gf]_\alpha ^\gamma  = \left[ g \right]_\beta ^\gamma \left[ f \right]_\alpha ^\beta \).

Định lý
Giả sử f, g, h là các ánh xạ tuyến tính. Khi đó
\(\begin{array}{l}h(gf) = (hg)f\\h(f + g) = hf + hg\\(f + g)h = fh + gh\end{array}\)
nếu các phép toán của hai vế đều có nghĩa.

Chứng minh:

Giả sử f, g,h là các ánh xạ tuyến tính \(f,g:V \to W,h:W \to U\).
Với \(\forall x \in V\):

\(\begin{array}{l}(f + g)(x) = f(x) + g(x)\\h(f + g)(x) = h((f + g)(x)) = h(f(x) + g(x))\\ = h(f(x)) + h(g(x)) = (hf)(x) + (hg)(x)\\ = (hf + hg)(x)\end{array}\)

Đổi cơ sở của ánh xạ tuyến tính (Change of basis for a linear map)

Giả sử V và W là hai không gian vector trên trường K có các cặp cơ sở \((\beta ,\gamma ),(\beta \prime ,\gamma \prime )\), \(f:V \to W\) là một ánh xạ tuyến tính từ V đến W với các ma trận tương ứng là A, B. Nếu \(P = {P_{\beta  \leftarrow \beta \prime }}\) và \(Q = {Q_{\gamma  \leftarrow \gamma \prime }}\) là các ma trận đổi cơ sở từ \(\beta  \leftarrow \beta \prime \) và \(\gamma  \leftarrow \gamma \prime \) thì \(B = {Q^{ - 1}}AP\)



Giả sử V là không gian vector trên trường K có các cơ sở \(\beta ,\gamma \), \(f:V \to V\) là một toán tử tuyến tính (tự đồng cấu) với các ma trận tương ứng với hai cơ sở là A, B. Nếu \(P = {P_{\beta  \leftarrow \gamma }}\) là ma trận đổi cơ sở từ \(\gamma  \to \beta \) thì \(B = {P^{ - 1}}AP\)





No comments:

Post a Comment