Processing math: 100%

2016-01-11

Linear Algebra: Linear mapping/map (ánh xạ tuyến tính)

Note lại 1 số kiến thức nền về đại số tuyến tính có liên quan đến đủ mọi thứ như SVD, PCA, optimization ... (không đầy đủ, xem thêm trong các tài liệu khác).

Linear Algebra MIT OCW

Search Results

Linear Algebra Done Right, by Sheldon Axler (Author), ISBN-13: 978-3319110790
...

Phần liên quan Matrices, Vectors, Eigenvectors & eigenvaluesBilinear form and Quadratic form

Linear mapping/map (ánh xạ tuyến tính)


Quan hệ hay liên hệ giữa các tập hợp được biểu diễn bằng ánh xạ.
Với không gian vector thì ánh xạ này cần thể hiện liên hệ của cả những phép toán toán (operator) khi giữa các không gian vector.

Đồng cấu (homomorphism)

Định nghĩa 1
Giả sử V và W là hai không gian vector trên trường K. Một ánh xạ f từ V đến W ký hiệu là f:VW gọi là một ánh xạ tuyến tính (linear mapping or linear transformation) hay một đồng cấu (hay cấu xạ đồng nhất homomorphism, cấu xạ-morphism mang ý nghĩa là ánh xạ bảo toàn cấu trúc structure-preserving map).

Nếu với x,yV,kK:

1.      f(x+y)=f(x)+f(y)
2.      f(kx)=kf(x)

Khi đó f(x) được gọi là ảnh của x. Nếu W=V thì f được gọi là tự đồng cấu (endomorphism). Tự đồng cấu f:VV còn gọi là toán tử tuyến tính (linear operator).

Hệ quả
1.      Giả sử V và W là hai không gian vector trên trường K. Một ánh xạ f từ V đến W ký hiệu là f:VW gọi là một ánh xạ tuyến tính khi và chỉ khi f(rx+sy)=rf(x)+sf(y),x,yV,r,sK
2.      Nếu f:VW là một ánh xạ tuyến tính thì f(0v)=0W
Ví dụ: f:R3R2 xác định bởi f((a1,a2,a3))=(a1,a2) là một đồng cấu (kiểm tra bằng định nghĩa).

Định nghĩa 2
Một ánh xạ tuyến tính (đồng cấu) được gọi là:

§  Đơn cấu (monomorphism) nếu nó là một đơn ánh (injective/injection)
§  Toàn cấu (epimorphism) nếu nó là một toàn ánh (surjective/surjection)
§  Đẳng cấu (isomorphism) nếu nó đồng thời là đơn ánh và toàn ánh (hay song ánh-bijective/bijection).
§  Tự đẳng cấu (automorphism) nếu là vừa là tự đồng cấu và đẳng cấu

Khi có một đẳng cấu từ không gian vector V sang W ký hiệu f:VW thì V, W được gọi là đẳng cấu với nhau.

Ánh xạ tuyến tính f:VW là một đẳng cấu khi và chỉ khi tồn tại một ánh xạ tuyến tính f1:WV sao cho f1f=1V,ff1=1W.

Chứng minh: nếu f là một đẳng cấu thì tồn tại một ánh xạ ngược f1, dùng điều kiện chứng minh f1 là một ánh xạ tuyến tính theo định nghĩa. Ngược lại nếu tồn tại một ánh xạ tuyến tính f1:WV sao cho f1f=1V,ff1=1W thì f là một song ánh, theo định nghĩa f là đẳng cấu.
Ví dụ: f:R3R2 xác định bởi f((a1,a2,a3))=(a1,a2) là một toàn cấu bởi vì β(a1,a2)R2 đều α(a1,a2,0)R3 sao cho f(α)=β.

Sự xác định của một ánh xạ tuyến tính

Định lý
Giả sử V và W là hai không gian vector trên trường K, β={b1,...,bn} là một cơ sở của V và x1,,xn là n vector tùy ý của W. Khi đó tồn tại duy nhất một ánh xạ tuyến tính f:VW sao cho f(bi)=xi,i=¯1,n.
Với u=r1b1+r2b2+...+rnbn chọn f xác định như sau f(u)=r1x1+r2x2+...+rnxnW. Do β={b1,...,bn} là cơ sở của V nên u,ri,n được xác định duy nhất hay f(u) xác định duy nhất, do đó f là một ánh xạ.


Chứng minh f là một ánh xạ tuyến tính.
Với u=r1b1+r2b2+...+rnbn,v=s1b1+s2b2+...+snbnV,kK:
u+v=(r1+s1)b1+(r2+s2)b2+...+(rn+sn)bnku=kr1b1+kr2b2+...+krnbn

Theo định nghĩa của f:
f(u+v)=(r1+s1)x1+(r2+s2)x2+...+(rn+sn)xn=f(u)+f(v)f(ku)=kr1x1+kr2x2+...+krnxn=kf(u)
Hơn nữa có thể viết bi=0b1+0b2+...+bi+...+0bn,bif(bi)=xi .

Để kiểm tra tính duy nhất của f, giả sử tồn tại một ánh xạ tuyến tính f:VW thỏa mãn điều kiện f(bi)=xi,i=¯1,n. Do f:VW là ánh xạ tuyến tính nên theo tính chất ánh xạ tuyến tính:
f(u)=f(r1b1+r2b2+...+rnbn)=r1f(b1)+r2f(b2)+...+rnf(bn)=r1x1+r2x2+...+rnxn=f(u)

Do đó f=f hay f là duy nhất.

Kết luận
§  Để xác định ánh xạ tuyến tính f:VW chỉ cần xác định ảnh của các vector cơ sở.
§  Mỗi hệ n vector của W xác định một ánh xạ tuyến tính từ V đến W nếu W0.

Hạt nhân/Nhân và ảnh của ánh xạ tuyến tính (Kernel & image)

Định nghĩa
Giả sử V, W là hai không gian vector trên trường K, f:VW là một ánh xạ tuyến tính, AV,BW là các không gian con.

Ảnh của A, hay tập hợp ảnh của A (image) ký hiệu Im(A) xác định:
f(A)={β=f(α)W|αA} là tập hợp các ảnh của mọi vector αA tạo do đồng cấu f.
Tập hợp f1(B)={αV|f(α)B} được gọi là tạo ảnh (ảnh ngược-preimage hay inverse image) của B.
Tập hợp f(V) gọi là ảnh của V hay còn gọi là ảnh của f Im(f).
Tập hợp f1(0W) được gọi là hạt nhân của f và ký hiệu là Ker(f).

Định lý
Giả sử V, W là hai không gian vector trên trường K, f:VW là một ánh xạ tuyến tính, AV,BW là các không gian con. Khi đó:

1.      f(A) là một không gian con của W. Nếu hệ vector {ε1,ε2,...,εn} là một hệ sinh của A thì hệ vector {f(ε1),f(ε2),...,f(εn)} là một hệ sinh của f(A).
2.      f1(B) là một không gian con của V.

Chứng minh:
0VA nên f(0V)f(A) hay f(A) (1).

Giả sử β1,β2f(A);r,sK, theo định nghĩa của f(A) là tập ảnh của A, tồn tại α1,α2A sao cho f(α1)=β1,f(α2)=β2.
Vì f là một ánh xạ tuyến tính nên rβ1+sβ2=rf(α1)+sf(α2)=f(rα1)+f(sα2)=f(rα1+sα2). Do A là một không gian con của V nên theo tính chất không gian vector rα1+sα2A, vì vậy rβ1+sβ2=f(rα1+sα2)f(A) (2).
Từ (1), (2) f(A)W.

Giả sử {e1,e2,...,en} là một hệ sinh của A khi đó f(ei)f(A). Do α là tổ hợp tuyến tính của hệ vector {e1,e2,...,en} nên α=x1e1+x2e2++xnen,f(α)=β:
β=f(α)=f(x1e1+x2e2++xnen)=x1f(e1)+x2f(e2)++xnf(en)

Do đó hệ {f(e1),f(e2),...,f(en)} là một hệ sinh của f(A).
Chứng minh tương tự f1(B)V.

Hệ quả
Giả sử V, W là hai không gian vector trên trường K, f:VW là một ánh xạ tuyến tính

§  Im(f) là không gian con của W
§  Ker(f) là không gian con của V
§  f là một toàn cấu khi Im(f)=W
§  f là một đơn cấu khi và chỉ khi (iff), Ker(f)=0V

Giả sử f là một đơn cấu và αKer(f), khi đó f(α)=0W=f(0V). Vì f là đơn cấu nên α=0V hay Ker(f)={0V}

Ngược lại nếu Ker(f)={0V}, khi f(α1)=f(α2) với α1,α2V.
Xét f(α1α2)=f(α1)f(α2)=0W do vậy α1α2Ker(f) hay α1α2=0Vα1=α2.

Đẳng cấu giữa hai không gian cùng số chiều

Định lý
Hai không gian vector trên trường K đẳng cấu khi và chỉ khi có cùng số chiều.
Giả sử f:VW là một đẳng cấu. Khi đó f đồng thời là một đơn cấu và toàn cấu.
Do đó Ker(f)=0,Im(f)=W, khi đó
dim(V)=dim(W)+dim(Ker(f))=dim(W)+0=dim(W)

Ngược lại:
Giả sử β={b1,b2,...,bn} là cơ sở của V và γ={g1,g2,...,gn} là một cơ sở của W có cùng số chiều là n. Do đó có một ánh xạ tuyến tính f:VW sao cho f(bi)=gi,i=¯1,n. Khi đó hệ γ={g1,g2,...,gn} cũng là hệ sinh của Im(f) nên Im(f)=W nên f là toàn cấu.
Hơn nữa dim(Ker(f))=dim(V)dim(Im(f))=0 nên f là một đơn cấu.

Kết luận f là một đẳng cấu nên V và W đẳng cấu với nhau.

Hệ quả 1
Giả sử V, W là hai không gian vector trên trường K, ánh xạ tuyến tính f:VW là một đẳng cấu khi và chỉ khi nó biến một cơ sở của V thành một cơ sở của W.

Hệ quả 2
Giả sử f:VV là toán tử tuyến tính, khi đó các mệnh đề sau tương đương:
1.      f đẳng cấu
2.      Tồn tại ánh xạ ngược f1
3.      f đơn cấu
4.      f toàn cấu

Tọa độ biểu diễn vector (Coordinate representation of vector)

Định nghĩa
Nếu β={b1,...,bn} là một cở sở của không gian vector V trên trường K. Khi đó, vV tồn tại duy nhất một bộ vô hướng a1,a2,,anK sao cho:
v=a1b1+a2b2+...+anbn

Khi đó tọa độ (coordinate vector hay β– coordinates) của vector v đối với cơ sở β (to the ordered basic) được định nghĩa là vector cột (column vector) thuộc Kn chứa các vô hướng ai, ký hiệu:

[v]β=[a1an]

Khi đó vector V viết lại như sau:

v=a1b1+a2b2+...+anbn=[b1bn][a1an]=B[v]β

Ánh xạ tọa độ (Coordinate mapping- coordinate isomorphism)
Nếu β={b1,...,bn} là một cơ sở của không gian vector V trên trường K. Khi đó tồn tại ánh xạ gọi là ánh xạ tọa độ (coordinate map) còn gọi là biểu diễn chuẩn (standard representation) của V đối với cơ sở β={b1,...,bn} từ V tới Kn (hay còn ký hiệu là Vn) ký hiệu ϕβ:VKn xác định bởi:

ϕβ(v)=[v]β
ϕβ:VKn cũng là một ánh xạ tuyến tính (linear map hay linear transformation) hơn nữa nó còn là một đẳng cấu (isomorphism).

Chứng minh:

Để chứng minh ϕβ là một đẳng cấu trước tiên phải chứng minh ϕβ là một ánh xạ tuyến tính. Giả sử x,yV do β={b1,...,bn} là cơ sở của V nên x, y có thể biểu diễn theo cơ sở này:

x=x1b1+x2b2+...+xnbny=y1b1+y2b2+...+ynbn

Xét: x+y=(x1+y1)b1+(x2+y2)b2+...+(xn+yn)bn
kK: kx=kx1b1+kx2b2+...+kxnbn
ϕβ(x+y)=[x+y]β=[x1+y1xn+yn]=[x1xn]+[y1yn]=[x]β+[y]β=ϕβ(x)+ϕβ(y)


ϕβ(kx)=[kx]β=[kx1kxn]=k[x1xn]=k[x]β=kϕβ(x)

Do đó ϕβ:VKn là một ánh xạ tuyến tính.

Chứng minh ánh xạ tuyến tính ϕβ là một đẳng cấu
Giả sử x,yVϕβ(x)=ϕβ(y), khi đó [x]β=[y]β. Do dạng biểu diễn theo cơ sở β của một vector là duy nhất nên x=y hay ϕβ là một đơn ánh.

Giả sử bất kỳ [x]β=[x1xn]Kn

Xét x=x1b1+x2b2+...+xnbnV thì ϕβ(x)=[x]β. Như vậy tất cả các phần tử của Kn đều có tạo ảnh. Do đó ϕβ là một toàn ánh.

Chuyển đổi tọa độ (Changing between coordinates with respect to two different bases)
Tổng quát cho không gian vector V trên trường K. Giả sử β={b1,...,bn}, γ={g1,...,gn} là các cơ sở của V. Khi đó với vV: [v]γ=Pγβ[v]β với Pγβ là ma trận n×n gọi là ma trận chuyển đổi (cơ sở) (transition matrix) từ β sang γ tạo thành từ các vector cột là tọa độ của b1,...,bn theo cơ sở γ.

Chứng minh:

Giả sử v=x1b1+...+xnbn hay [v]β=[x1xn]
Gọi các ánh xạ tọa độ tương ứng là ϕβ,ϕγ:VKn

Do ϕγ là ánh xạ tuyến tính nên:

[v]γ=ϕγ(v)=ϕγ(x1b1+...+xnbn)=ϕγ(x1b1)+...+ϕγ(xnbn)=x1ϕγ(b1)+...+xnϕγ(bn)=x1[b1]γ+...+xn[bn]γ==[[b1]γ||[bn]γ][x1xn]=Pγβ[v]β

Tổng quát với  α,β,γ là cơ sở của V:

1.      Pαα=In
2.      Pαγ=PαβPβγ
3.      Pαβ=(Pβα)1

Chứng minh (2)
Với vV theo định nghĩa:
Pαγ[v]γ=[v]α=Pαβ[v]β=Pαβ(Pβγ[v]γ)
Theo tính chất phép nhân ma trận

Pαγ[v]γ=[v]α=Pαβ[v]β=Pαβ(Pβγ[v]γ)=(PαβPβγ)[v]γ,vV
Do đó  Pαγ=PαβPβγ

Chứng minh (3)
Theo (2) với γ=αPαγ=PαβPβγPαα=PαβPβαIn=PαβPβα

Ý nghĩa


Ánh xạ hợp ϕγϕβ1:KnKn là một ánh xạ tuyến tính từ Kn tới chính nó biểu diễn bởi: xPγβx, trong đó Pγβ là ma trận n×n gọi là ma trận chuyển đổi (cơ sở) (transition matrix) từ β sang γ .

Chứng minh: dùng tính chất phép nhân ma trận.

Ma trận biểu diễn ánh xạ tuyến tính (Matrix representation of linear map)

Định nghĩa
Giả sử V và W là hai không gian vector trên trường K, β=(b1,...,bn) là một cơ sở của V và γ=(g1,,gm) là một cơ sở của W, f:VW là một ánh xạ tuyến tính từ V đến W.

Do các vector bjVf(bj)W,j=¯1,n, mặc khác γ=(g1,,gm) là một cơ sở của W nên f(bj) có thể biểu diễn theo cơ sở γ=(g1,,gm):

f(bj)=a1jg1+a2jg2+...+amjgm=mi=1aijgi,i=¯1,m[f(bj)]γ=[a1jamj]

Khi đó ma trận m×n A=(aij) có các vector cột là tọa độ của f(bj) trong cơ sở γ gọi là ma trận biểu diễn ánh xạ tuyến tính f:VW đối với cặp cơ sở (β,γ).

A=[f]γβ=[[f(b1)]γ|[f(b2)]γ||[f(bn)]γ]=[a11a1nam1amn]

Trong trường hợp f là tự đồng cấu V=Wβ=γ có thể viết  [f]β thay vì [f]ββ.

Định lý
Giả sử V và W là hai không gian vector trên trường K với cặp cơ sở (β,γ), f:VW là một ánh xạ tuyến tính từ V đến W, thì uV:
[f(u)]γ=[f]γβ[u]β

Chứng minh:

Do uV nên có thể biểu diễn bởi cơ sở β=(b1,...,bn): u=nj=1ujbj

Do f và ϕγ là ánh xạ tuyến tính nên theo tính chất của ánh xạ tuyến tính:
f(u)=f(nj=1ujbj)=nj=1f(ujbj)=nj=1ujf(bj)[f(u)]γ=ϕγ(nj=1ujf(bj))=nj=1ujϕγ(f(bj))=nj=1uj[f(bj)]γ[f(u)]γ=[[f(b1)]γ|[f(b2)]γ||[f(bn)]γ][u1un]=[f]γβ[u]β
[f(u)]γ=[f]γβ[u]β còn gọi là biểu thức tọa độ của ánh xạ tuyến tính f đối với cặp cơ sở (β,γ).

Khi chỉ đề cập ánh xạ tuyến tính f:VW mà không chỉ định cặp cơ sở (β,γ) có nghĩa ngầm định ánh xạ được xét sử dụng cơ sở chính tắc của V, W. Ma trận trong cặp cơ sở chính tắc gọi là ma trận chính tắc.

Tổng hai ánh xạ tuyến tính (Sum of two linear maps)

Định nghĩa
Giả sử V và W là hai không gian vector trên trường K, f, g là ánh xạ tuyến tính từ V đến W f,g:VW. Tổng của hai ánh xạ tuyến tính ký hiệu f+g được định nghĩa:
(f+g)(x)=f(x)+g(x)

Ánh xạ tổng f+g của hai ánh xạ tuyến tính f và g là một ánh xạ tuyến tính.

Chứng minh:

Với α,βV,r,sK:
(f+g)(rα+sβ)=f(rα+sβ)+g(rα+sβ)=rf(α)+sf(β)+rg(α)+sg(β)=r[f(α)+g(α)]+s[f(β)+g(β)]=r(f+g)(α)+s(f+g)(β)

Do đó f+g là một ánh xạ tuyến tính

Định lý
Giả sử V và W là hai không gian vector trên trường K lần lượt có cơ sở là (β,γ). Giả sử f, g là ánh xạ tuyến tính từ V đến W f,g:VW ứng với hai cơ sở (β,γ):
[f+g]γβ=[f]γβ+[g]γβ

Chứng minh:
Với f+g,ϕγ là các ánh xạ tuyến tính, uV
[(f+g)(u)]γ=ϕγ((f+g)(u))=ϕγ(f(u)+g(u))=ϕγ(f(u))+ϕγ(g(u))=[f(u)]γ+[g(u)]γ

Mặc khác [(f+g)(u)]γ=[f+g]γβ[u]β,[f(u)]γ=[f]γβ[u]β,[g(u)]γ=[g]γβ[u]β nên
[f+g]γβ[u]β=[f]γβ[u]β+[g]γβ[u]β=([f]γβ+[g]γβ)[u]β,uV
[f+g]γβ=[f]γβ+[g]γβ

Tích của một ánh xạ tuyến tính với vô hướng (multiplication of linear maps with scalars)

Định nghĩa
Giả sử V và W là hai không gian vector trên trường K, f là ánh xạ tuyến tính từ V đến W f:VW. Tích của một ánh xạ tuyến tính với vô hướng (scalar multiplication) kK, ký hiệu kf được định nghĩa
(kf)(x)=kf(x)

Với k=1 tích của ánh xạ f với k: (1)f gọi là ánh xạ đôi của f và ký hiệu là f.
Tích của một ánh xạ tuyến tính với vô hướng (scalar multiplication) là một ánh xạ tuyến tính.

Định lý
Giả sử V và W là hai không gian vector trên trường K với cặp cơ sở tương ứng là (β,γ). Giả sử f là một ánh xạ tuyến tính từ V đến W f:VW, kKvô hướng (scalar multiplication).
[kf]γβ=k[f]γβ

Tích của hai ánh xạ tuyến tính (multiplication of linear maps/composite of linear maps)

Định nghĩa
Giả sử V và W là hai không gian vector trên trường K, f, g là các ánh xạ tuyến tính f:VW,g:WU. Tích của hai ánh xạ f và g ký hiệu là gf được xác định như sau:
(gf)(x)=g(f(x))

Tích của hai ánh xạ tuyến tính cũng là một ánh xạ tuyến tính.

Chứng minh:

Với α,βV,r,sK:
(gf)(rα+sβ)=g(f(rα+sβ))=g(f(rα))+g(f(sβ))=g(rf(α))+g(sf(β))=r(gf)(α)+s(gf)(β)

Do đó gf là một ánh xạ tuyến tính.
Tích của hai ánh xạ tuyến tính còn gọi là hợp của hai ánh xạ tuyến tính (composite of two linear maps) và ký hiệu là gf

Tương đương với phép nhân ma trận (Equivalence of composition and matrix multiplication)
Giả sử V, W, và Z là các không gian vector trên trường K lần lượt có các cơ sở là α,β,γ. Giả sử f, g là hai ánh xạ tuyến tính f:UV,g:VW:
[gf]γα=[g]γβ[f]βα


Chứng minh:

Giả sử α=(u1,u2,...,up),β=(v1,v2,...,vn),γ=(w1,w2,...,wm)

Do uiUf(ui)V,i=¯1,p, ma trận chuyển đổi n×p từ αβ tương ứng f(ui)=nj=1ajivj,j=¯1,n
[f]βα=[a11a1pan1anp]

Tương tự do vjVg(vj)W,j=¯1,n, ma trận chuyển đổi m×n từ βγ tương ứng g(vj)=mk=1bkjwk,k=¯1,m
[g]γβ=[b11b1nbm1bmn]

Do đó g(f(ui))=g(nj=1ajivj)=nj=1ajig(vj)=nj=1ajimk=1bkjwk

Đổi thứ tự tính tổng g(f(ui))=nj=1ajimk=1bkjwk=mk=1(nj=1bkjaji)wk

Đặt cki=nj=1bkjaji\]khiđó:\(gf(ui)=g(f(ui))=mk=1ckiwk.

Theo định nghĩa, ma trận chuyển đổi m×p từ αγ là:
[gf]γα=[c11c1pcm1cmp]

Như do cki=nj=1bkjaji nên [gf]γα=[g]γβ[f]βα.

Định lý
Giả sử f, g, h là các ánh xạ tuyến tính. Khi đó
h(gf)=(hg)fh(f+g)=hf+hg(f+g)h=fh+gh
nếu các phép toán của hai vế đều có nghĩa.

Chứng minh:

Giả sử f, g,h là các ánh xạ tuyến tính f,g:VW,h:WU.
Với xV:

(f+g)(x)=f(x)+g(x)h(f+g)(x)=h((f+g)(x))=h(f(x)+g(x))=h(f(x))+h(g(x))=(hf)(x)+(hg)(x)=(hf+hg)(x)

Đổi cơ sở của ánh xạ tuyến tính (Change of basis for a linear map)

Giả sử V và W là hai không gian vector trên trường K có các cặp cơ sở (β,γ),(β,γ), f:VW là một ánh xạ tuyến tính từ V đến W với các ma trận tương ứng là A, B. Nếu P=PββQ=Qγγ là các ma trận đổi cơ sở từ ββγγ thì B=Q1AP



Giả sử V là không gian vector trên trường K có các cơ sở β,γ, f:VV là một toán tử tuyến tính (tự đồng cấu) với các ma trận tương ứng với hai cơ sở là A, B. Nếu P=Pβγ là ma trận đổi cơ sở từ γβ thì B=P1AP





No comments:

Post a Comment