Loading [MathJax]/jax/output/HTML-CSS/jax.js

2016-01-13

Eigenvectors and Eigenvalues (vector riêng/đặc trưng và giá trị riêng/đặc trưng)

Note lại 1 số kiến thức nền về đại số tuyến tính có liên quan đến đủ mọi thứ như SVD, PCA, optimization ... (không đầy đủ, xem thêm trong các tài liệu khác).

Linear Algebra MIT OCW
Linear Algebra Done Right, by Sheldon Axler (Author), ISBN-13: 978-3319110790
...

Tiếp theo phần Vectors và Matrices

Eigenvectors and Eigenvalues (vector riêng/đặc trưng và giá trị riêng/đặc trưng)


Cho A là ma trận vuông cấp n trên trường F (F= ℝ; ℂ). Một số λF(scalar) được gọi là giá trị riêng (hay gọi tắt là trị riêng) của ma trận A nếu tồn tại một vector xFn,x0 sao cho Ax=λx.
Nếu x=(x1,x2,,xn) là vector riêng của ma trận A với trị riêng λ thì với mọi số vô hướng α0αx cũng là vector riêng của A ứng với trị riêng λ. Tất cả các vector riêng có cùng giá trị riêng cùng vector 0, tạo thành một không gian riêng (eigenspace) ký hiệu là Eλ. HayEλlà không gian nghiệm (nullspace) của phương trình (AλI)x=0 (hệ phương trình tuyến tính thuần nhất). Eλ là không gian con của Fn.

Tính chất:
§  λ chính là nghiệm của phương trình pA(z)=det(AzI)=0 gọi là phương trình đặc trưng của ma trận A. pA(z)=det(AzI) gọi là đa thức đặc trưng của ma trận A.
§  Một giá trị riêng có thể ứng với nhiều vector riêng (dox0nên hệ phương trình thuần nhất có một nghiệm khác 0, có nghĩa hệ có vô số nghiệm)
§  Mỗi vector riêng chỉ ứng với một giá trị riêng duy nhất
§  Ma trận A là nghiệm của đa thức đặc trưng của chính nó (trong trường hợp này đa thức đặc trưng được coi là đa thức ma trận, nghĩa là biến số của nó không phải là biến số thực mà là biến ma trận).
§  Nếu λ=0 là giá trị riêng của ma trận A thì A không khả nghịch. Ngược lại, nếu mọi giá trị riêng của A đều khác không thì A khả nghịch.
§  Nếu λ là giá trị riêng của A thìλk là giá trị riêng của Ak.
Ví dụ về eigenvectors và eigenvalues:
Một biến đổi tuyến tính (linear transformation) T(x1,x2)=(5x1,15x2) có ý nghĩa hình học đơn giản dễ thấy: kéo dãn (stretch) 5 lần theo chiều x1(x1direction) và 15 lần theo chiều x2.



Ngược lại T(x1,x2)=(13x14x2,4x1+7x2) không có ý nghĩa hình học đơn giản như ví dụ trên.
Tuy nhiên bằng cách sử dụng hai vector cơ sở (basic vectors) v1=(1,2),v2=(2,1):
T(v1)=(13(1)4(2),4(1)+7(2))=(5,10)=5v1T(v2)=(13(2)4(1),4(2)+7(1))=(30,15)=15v2
Có nghĩa phép biến đổi T có ý nghĩa hình học đơn giản là kéo dãn 5 lần theo v1direction và 15 lần theo v2direction. Có thể thấy v1=(1,2),v2=(2,1) chính là các eigenvectors của T tương ứng với các eigenvalues là λ1=5,λ2=15 (WolframAlpha “eigenvectors {{13,-4},{-4,7}}”)

Characteristic Polynomial (đa thức đặc trưng)


Đa thức bậc n của biến z gọi là đa thức đặc trưng của ma trận A là đa thức ký hiệu pA(z) hay PA(z) được định nghĩa như sau: pA(z)=det(AzI).

§  Các nghiệm của đa thức đặc trưng gọi là giá trị riêng của ma trận A

§  Nếu λ là một giá trị riêng của A thì det(AλI)=0 do đó hệ phương trình thuần nhất
(AλI)[x1xn]=[00]
 có vô số nghiệm. Không gian nghiệm của phương trình trên gọi là không gian con riêng của ma trận A ứng với giá trị riêng λ. Các vector khác không là nghiệm của phương trình trên gọi là các vector riêng của ma trận A ứng với giá trị riêng λ, tạo thành một cơ sở của không gian riêng gọi là các vector riêng độc lập tuyến tính với giá trị riêng λ.

Định lý:
Vô hướng λ là giá trị riêng của A khi và chỉ khi pA(λ)=0
Chứng minh:

Số λ là giá trị riêng của A khi và chỉ khi tồn tại một vector xFn,x0 sao cho Ax=λx. Khi đó hệ phương trình tuyến tính (AλI)x=0 có nghiệm x0 hay tương đương hệ phương trình có vô số nghiệm det(AλI)=0.

Ví dụ: tìm đa thức đặc trưng, vector riêng và giá trị riêng của ma trận
A=[011101110]
Đa thức đặc trưng của ma trận A pA(λ)=[λ111λ111λ]=λ3+3λ+2

pA(λ)=0(λ+1)2(2λ)=0λ=1λ=2
Ma trận A có hai giá trị riêng là λ=1 và λ=2
Tìm trị vector riêng của A

§  Với λ=1 hệ [111111111|000] có vô số nghiệm phụ thuộc hai tham số x2,x3.

Nghiệm tổng quát là
x1=ab,x2=a,x3=b. Không gian con riêng của A ứng với giá trị riêng λ=1 là E1={(ab,a,b)|a,bR} là tất cả các vector có dạng (ab,a,b) với a2+b20 (vì vector riêng phải khác 0). Như vậy dimE(1)=2 và A có 2 vector riêng độc lập tuyến tính ứng với giá trị riêng λ=1 là α1=(1,1,0),α2=(1,0,1)

§  Với λ=2 hệ [211121112|000](1)\vboxto.5ex\vss(3)[112121211|000](2)=(2)1(3)=(3)+2(2)[100133233|000][100130230|000] có vô số nghiệm phụ thuộc tham số x3. Nghiệm tổng quát là x1=a,x2=a,x3=a. Không gian con riêng của A ứng với giá trị riêng λ=2 là E2={(a,a,a)|aR} là tất cả các vector có dạng (a,a,a) với a0 (vì vector riêng phải khác 0). Như vậy dimE(2)=1và A có 1 vector riêng độc lập tuyến tính ứng với giá trị riêng λ=2 là α3=(1,1,1).

§  Với cả hai trường hợp A có 3 vector riêng độc lập tuyến tính là α1=(1,1,0),α2=(1,0,1),α3=(1,1,1)

Do pA(z)là đa thức nên theo Định lý cơ bản của đại số (Fundamental theorem of algebra) mọi đa thức một biến có số nghiệm phức bằng bậc của nó, nếu mỗi nghiệm được tính với số bội của nó. Khi đó
pA(z)=(zλ1)(zλ2)...(zλn)
với  λiC (trường số phức). Như vậy ma trận A trên trường số thực có thể có giá trị riêng ảo.

Algebraic Multiplicity (Vô số/hệ số đại số)


Nếu giá trị riêng λi xuất hiện k lần trong biểu diễn đa thức pA(z) trên thì gọi λi là giá trị riêng bội k của A. Với k = 1 thì λi gọi là giá trị riêng đơn. Khi đó số lần lặp lại k của giá trị riêng λi được gọi là vô số/hệ số đại số (algebraic multiplicity) của λi ký hiệu là AM(λi) hay μA(λi).
Hệ số đại số của giá trị riêng luôn lớn hơn hay bằng hệ số hình học hay dimE(λi)k.

§  Nếu μA(λi)=1 khi đóλi gọi là giá trị riêng đơn (simple eigenvalue).

§  Nếu μA(λi)=γA(λi)khi đó λi gọi là semisimple eigenvalue (xem Geometric Multiplicity)

Geometric Multiplicity (Vô số/hệ số hình học)


Số chiều của không gian riêng Eλ tương ứng dimE(λ) hay chính là số vector riêng độc lập tuyến tính ứng với  giá trị riêng λi gọi là vô số/hệ số hình học (geometric multiplicity) của λi ký hiệu là GM(λi) hay γA(λi). Nếu λ và λ là hai giá trị riêng khác nhau thì EλEλ={0}.

Similarity Transformation (biến đổi đồng dạng/tương đương)


Hai ma trận vuông A và B cấp n gọi là đồng dạng với nhau ký hiệu AB nếu tồn tại một ma trận không suy biến (khả nghịch) P sao cho B=P1AP. Quan hệ đồng dạng là một quan hệ tương đương.
Ma trận A và B gọi là unitarily similar (có khi còn gọi là unitarily equivalent) nếu B=UAU với U là unitary.
Ma trận P đại diện cho phép biến đổi ma trận gốc A. Phép biến đổi AP1APgọi là phép biến đổi đồng dạng/tương đương hay sự kết hợp/liên hợp (conjugation) của ma trận A, B gọi là ma trận liên hợp (conjugate matrix) của ma trận A. Hai ma trận đồng dạng (tương đương) có nhiều tính chất:

§  pA(λ)=pB(λ)

§  Cùng trị riêng, các trị riêng có cùng vô số hình học, vô số đại số

§  det(A)=det(B), rank(A)=rank(B), tr(A)=tr(B)

Ví dụ:
ChoB=P1AP là ma trận đồng dạng với ma trận A.
det(BλIn)=det(P1APλIn)=det(P1APλP1InP)
=det(P1(AλIn)P)=det(P1)det(AλIn)det(P)=det(AλIn)

Eigenvalue Decomposition (phân tích giá trị riêng)


Cho λ1,λ2,...,λn là các giá trị riêng của ma trận A và x1,x2,...,xn là các vector riêng tương ứng. Gọi Λnxn là ma trận chéo n×n được tạo thành bởi λj và X là ma trận cột được tạo thành từ các vector riêng (cột thứ j của X là vector xj viết ở dạng cột). Khi đó do Axj=λxj:


[A]=[x1|x2|...|xn]=[x1|x2|...|xn][λ1λn]

AX=XΛ

Giả định A có n vector độc lập tuyến tính với nhau, thì X khả nghịch tồn tại X1 và:
A=XΛX1
Cách viết này được gọi là phân tích giá trị riêng (eigenvalue decomposition) của ma trận A.

Diagonalizability (khả năng chéo hóa được)


Cho A là ma trận vuông cấp n, ma trận A chéo hóa được nếu tồn tại một ma trận P là ma trận vuông cấp n không suy biến (khả nghịch) sao cho B=P1AP là ma trận chéo (lưu ý lúc này A=PBP1).

Chéo hóa ma trận A là tìm ma trận P vuông cấp n sao cho B=P1AP là ma trận chéo.
Nếu chéo hóa được ma trận A thì việc thao tác/nghiên cứu các tính chất trên A có thể đưa về việc thao tác/nghiên cứu các tính chất trên một ma trận chéo dễ dàng hơn.
Định lý: (điều kiện cần và đủ để một ma trận vuông chéo hóa được)

Ma trận A vuông cấp n chéo hóa được khi và chỉ khi A có đủ n vector riêng độc lập tuyến tính và ki=1dimE(λi)=n trong đó λi là tất cả các giá trị riêng của A.
Nếu ma trận A vuông cấp n có n trị riêng phân biệt (distinct eigenvalues) trong trường F thì sẽ chéo hóa được trên trường F (không có chiều ngược lại). Có n trị riêng phân biệt tương đương mọi giá trị riêng của A đều có vô số/hệ số đại số bằng vô số/hệ số hình học.
Lưu ý: ma trận đơn vị A=diag(1,1) đã là ma trận chéo chỉ có eigenvalue λ=1 ứng với hai eigenvectors v1=(0,1),v2=(1,0).

Nếu A chéo hóa được thì ma trận P cần tìm là ma trận cột có các cột là các vector riêng độc lập tuyến tính của A viết theo cột.

Ví dụ:
A=[011101110]có 2 giá trị riêng λ1=1,λ2=2 (lưu ý λ1có vô số/hệ số đại số là 2) và 3 vector riêng độc lập tuyến tính α1=(1,1,0),α2=(1,0,1),α3=(1,1,1).

Ma trận P cần tìm: P=[α1|α2|α3]=[110101111]

Ma trận chéoB=P1AP=[100010002]

Ví dụ khác ứng dụng tính lũy thừa n của ma trận A=[1124]

Tìm trị riêng và vector riêng của A pA(λ)=0(λ2)(λ3)=0λ=2λ=3
Các vector riêng α1=[1,1],α2=[1,2]
Ma trận làm chéo hóa P: P=[1112]

P1=[2111]

Chéo hóa P1AP=[2111][1124][1112]=[2003]


Chứng minh được An=PBnP1:
(P1AP)2=(P1AP)(P1AP)=P1A2P
(P1AP)3=(P1AP)(P1A2P)=P1A3P

Do đó:
Bn=(P1AP)n=P1AnP=[2n003n]

An=P[2n003n]P1=[2n+13n2n3n2(2n3n)2n+2.3n]

Matrix Decomposition (phân tích/triển khai ma trận)


Phân tích/triển khai/khai triển ma trận (matrix decomposition) hay ma trận nhân tử (matrix factorization) là thực hiện phân tích thừa số/ nhân tử hóa (factorization) của một ma trận thành tích của nhiều ma trận. Có nhiều loại phân tích ma trận khác nhau. Một số các phân tích ma trận dựa trên giá trị riêng và vector riêng có thể kể đến như sau:
§  Eigenvalue decomposition (phân tích giá trị riêng)
§  Jordan decomposition
§  Schur decomposition
§  Singular value decomposition (SVD - phân tích giá trị kỳ dị/đặc biệt/đơn)

§  

No comments:

Post a Comment