Tổng quan về ma trận

Matrix là gì

Với số nguyên dương (n), tập hợp tất cả các ma trận kích thước (ntimes n) được đóng kín dưới phép toán cộng và nhân, tạo thành một vành không giao hoán. Định nghĩa phép toán và nhân ma trận không được đề cập ở đây.

Transpose Matrix

Nếu đổi hàng thành cột, cột thành hàng của ma trận A ta được ma trận chuyển vị (aka transpose matrix), ký hiệu là (A^T)

Có thể chứng minh được rằng:

[(AB)^T = B^TA^T]

Determinant

Cho (A) là một ma trận vuông kích thước (ntimes n). Ma trận con (submatrix) của (A) tương ứng với phần tử (a_{i,j}), ký hiệu là (M_{i,j}) được suy ra bằng cách bỏ hàng (i) và cột (j) trong ma trận (A). Định thức của ma trận này gọi là định thức con (minor).

Định thức của (A), ký hiệu (vert Avert) được định nghĩa đệ quy như sau:

  • Nếu (n = 1), (vert Avert = A_{1, 1})
  • Nếu (n > 1),

[vert Avert = sum^n_{j = 1} (-1)^{i+j}a_{i,j}vert M_{i,j}vert]

(tự chọn dòng (i) bất kỳ).

Biểu thức ((-1)^{i+j}vert M_{i,j}vert) còn được gọi là phụ đại số (cofactor) của phần tử (a_{i,j}), ký hiệu (C_{i,j}). Như vậy, công thức tính định thức ma trận (A) có thể phát biểu gọn: “Định thức ma trận (A) bằng tổng các ‘tích phụ đại số với phần tử tương ứng’ trên một hàng hoặc một cột bất kỳ.”

Tính chất

  • (vert Avert = vert A^Tvert). Hệ quả: nếu một tính chất đã đúng với hàng của định thức thì nó cũng đúng với cột.
  • Đổi chỗ hai dòng (hoặc hai cột) làm đổi dấu định thức.
  • Một định thức có dòng toàn số 0 thì bằng 0.
  • Nhân các phần tử của một hàng hoặc một cột với một hằng số (k) thì được định thức mới có giá trị bằng định thức cũ nhân với (k). Tips: Khi một dòng / cột có ước chung, ta có thể đưa ước chung đó ra ngoài dấu định thức.
  • Cộng bội (k) của một hàng vào một hàng khác giữ nguyên giá trị định thức.
  • Nếu (A) và (B) là hai ma trận vuông cùng cấp, thì (vert ABvert = vert Avert vert Bvert)

Nếu (A) có dạng sau:

  • Ma trận tam giác trên: (begin{bmatrix} a_{1,1} & a_{1,2} & dots & a_{1,n}\ 0 & a_{2,2} & dots & a_{2,n} \ vdots & vdots & ddots & vdots \ 0 & 0 & dots & a_{n,n} \ end{bmatrix})

  • Ma trận tam giác dưới: (begin{bmatrix} a_{1,1} & 0 & dots & 0\ a_{2,1} & a_{2,2} & dots & 0 \ vdots & vdots & ddots & vdots \ a_{n,1} & a_{n,2} & dots & a_{n,n} \ end{bmatrix})

Thì (vert Avert = prod^n_{i=1} a_{i,i}) (tích các số trên đường chéo chính)

Như vậy, thông thường để tính định thức ta dùng các tính chất để biến đổi sang các định thức tương đương và đưa về ma trận tam giác rồi tính cho dễ.

Inverse Matrix

Identity Matrix

Ma trận đơn vị (thường ký hiệu là (I), aka identity matrix) là một ma trận vuông trong đó tất cả các số trên đường chéo chính bằng 1, các phần tử còn lại bằng 0.

Cho (A) là một ma trận cùng cấp với (I), ta luôn có:

[AI = IA = A]

Invertible Matrix

Xét (A) là một ma trận vuông cấp (n), nếu tồn tại một ma trận (B) cùng cấp sao cho (AB = BA = I) thì (B) được gọi là ma trận nghịch đảo của (A). Lúc đó ta nói (A) khả đảo (inversible) và không suy biến (non-degenerate)

Adjugate Matrix

Ma trận phụ đại số:

[C = begin{bmatrix} C_{1,1} & C_{1,2} & dots & C_{1,n}\ C_{2,1} & C_{2,2} & dots & C_{2,n} \ vdots & vdots & ddots & vdots \ C_{n,1} & C_{n,2} & dots & C_{n,n} \ end{bmatrix}]

với (C_{i,j}) là phụ đại số tương ứng với phần tử (a_{i,j}) trong ma trận (A).

Ma trận (C^T) (ma trận chuyển vị của (C)) gọi là ma trận liên hợp (adjoint matrix).

Inverse Matrix

Ma trận nghịch đảo của (A), ký hiệu (A^{-1}), được tính như sau:

[A^{-1} = frac{1}{vert Avert }C^T]

Điều kiện cần và đủ để tồn tại (A^{-1}) là (vert Avert neq 0)

Tính chất

Giả sử (A) và (B) là hai ma trận vuông cùng cấp (n) và khả đảo. Khi đó:

  • Tích (AB) cũng khả đảo, và ((AB)^{-1} = B^{-1}A^{-1}).
  • (A^{-1}) cũng khả đảo, và ((A^{-1})^{-1} = A).
  • (A^m) cũng khả đảo, và ((A^m)^{-1} = (A^{-1})^m).
  • (kA) cũng khả đảo ((kneq 0)), và ((kA)^{-1}=frac{1}{k}A^{-1})

Linear System

Hệ phương trình tuyến tính là một hệ (m) phương trình đại số bậc nhất và (n) ẩn số:

[left{begin{matrix} a_{1,1}x_1 & + & a_{1,2}x_2 & + & dots & + & a_{1,n}x_n & = & b_1\ a_{2,1}x_1 & + & a_{2,2}x_2 & + & dots & + & a_{2,n}x_n & = & b_2\ dots & dots & dots & dots & dots & dots & dots & dots & dots\ a_{m,1}x_1 & + & a_{m,2}x_2 & + & dots & + & a_{m,n}x_n & = & b_m\ end{matrix}right.]

  • Nếu (m=n) ta có hệ vuông (square system) với (n) phương trình (n) ẩn.
  • Khi tất cả (b_i=0) ta có hệ phương trình thuần nhất (homogeneous system).

Hệ phương trình trên có thể được viết lại thành một phương trình giữa các ma trận: (Ax = b), với:

[A = begin{bmatrix} a_{1,1} & a_{1,2} & dots & a_{1,n}\ a_{2,1} & a_{2,2} & dots & a_{2,n}\ vdots & vdots & ddots & vdots\ a_{m,1} & a_{m,2} & dots & a_{m,n} end{bmatrix}] [x = begin{bmatrix} x_1 & x_2 & dots & x_n end{bmatrix}^T] [b = begin{bmatrix} b_1 & b_2 & dots & b_m end{bmatrix}^T]

Nếu một hệ vuông có (vert Avert neq 0) thì hệ đó được gọi là hệ Cramer. Nghiệm duy nhất của hệ Cramer bằng:

[x = A^{-1}b]

Gauss-Jordan Elimination

Augmented Matrix

Ma trận bổ sung (augmented matrix) được hình thành bằng cách ghép (A) và (b) thành một ma trận mới có dạng:

[M = left[begin{array}{cccc|c} a_{1,1} & a_{1,2} & dots & a_{1,n} & b_1\ a_{2,1} & a_{2,2} & dots & a_{2,n} & b_2\ vdots & vdots & ddots & vdots & vdots\ a_{n,1} & a_{n,2} & dots & a_{n,n} & b_n\ end{array}right]]

Elementary Row Operations

Khi thực hiện các phép biến đổi sau lên ma trận (M) sẽ không làm thay đổi kết quả của hệ, gọi là phép biến đổi hàng sơ cấp:

  • Đổi chỗ hai hàng
  • Nhân một hàng với một số khác 0
  • Cộng bội (k) của một hàng vào một hàng khác

Giải hệ vuông

Phương pháp Gauss là phương pháp giải hệ vuông bằng cách đưa (M) về dạng tam giác trên. Khi đó, hệ có thể giải một cách đơn giản từ (x_n) dần về (x_1).

Phương pháp Gauss-Jordan có sự khác biệt nhỏ: sau khi đưa (M) về dạng tam giác trên, ta tiếp tục đưa nó về dạng ma trận đơn vị.

Xem thêm ví dụ.

Tìm ma trận nghịch đảo

Phương pháp tìm ma trận nghịch đảo của (A):

  • Gọi (M) là ma trận khối (aka block matrix) bằng cách ghép (I) và (A) với nhau.
  • Áp dụng phép biến đổi sơ cấp hàng lên (M) để đưa ma trận bên trái về (I).
  • Lúc này, ma trận bên phải là (A^{-1}).

Xem thêm ví dụ.

Hệ thuần nhất

Hệ thuần nhất luôn có nghiệm (x = [0 0 dots 0]^T). Nghiệm này gọi là nghiệm tầm thường (trivial solution). Tuy nhiên chúng ta thường quan tâm đến nghiệm không tầm thường (non-trivial). Điều kiện cần và đủ để hệ thuần nhất có nghiệm không tầm thường là (vert Avert =0). Vì nếu (vert Avert neq 0) thì hệ đã có nghiệm duy nhất, và đó chỉ là nghiệm tầm thường.

Rank

Ma trận vuông cấp (k) suy từ (A) bằng cách bỏ đi (m-k) hàng và (n-k) cột gọi là ma trận con cấp (k) của (A). Định thức của ma trận này gọi là định thức con cấp (k) của (A). Theo định nghĩa, hạng của (A), ký hiệu (mathrm{rank}(A)) hoặc (rho(A)), là cấp cao nhất của một định thức con khác 0 trong (A).

Tuy nhiên trong thực hành chúng ta hiếm khi sử dụng định nghĩa này để tính hạng của ma trận. Thay vào đó, ta dùng các phép biến đổi hàng sơ cấp lên (A) để đưa nó về dạng bậc thang. Các phép biến đổi này không làm thay đổi hạng của ma trận.

Ma trận bậc thang theo hàng (row echelon form) được định nghĩa như sau:

  • Các hàng khác 0 luôn nằm trên hàng 0
  • Giữa hai hàng khác 0, phần tử đầu tiên khác 0 của hàng (gọi là pivot) trên phải nằm bên trái so với phần tử đầu tiên khác 0 của hàng dưới.
    • Các cột có chứa pivot được gọi là pivot column

Ví dụ:

[begin{bmatrix} textbf{1} & 3 & 0 & 5 & -1\ 0 & textbf{-4} & 2 & 3 & -1\ 0 & 0 & 0 & textbf{8} & -6 end{bmatrix}]

là một ma trận bậc thang

Tính chất:

  • Hạng của ma trận bậc thang bằng số dòng khác 0 của nó
  • Mỗi hàng (khác hàng 0) đều có một pivot

Kronecker – Capelli Theorem

Xét ma trận bổ sung (M = [Avert b]) và hệ tuyến tính (m) phương trình (n) ẩn, viết gọn là (Ax=b). Điều kiện cần và đủ để hệ có nghiệm là:

[rho(A) = rho(M) = k]

Khi đó, nếu (k < n) thì hệ có vô số nghiệm. Nếu (k = n) thì hệ có nghiệm duy nhất. Không có trường hợp (k > n).

Minh họa (giả sử (M) đã được đưa về row echelon form):

  • (k < n), hệ đã cho tương đương với hệ sau:

[left{begin{matrix} a_{1,1}x_1 + a_{1,2}x_2 + dots + a_{1,n}x_n & = & b_1\ a_{2,1}x_1 + a_{2,2}x_2 + dots + a_{2,n}x_n & = & b_2\ & vdots\ a_{k,1}x_1 + a_{k,2}x_2 + dots + a_{k,n}x_n & = & b_k\ 0 & = & 0\ & vdots\ end{matrix}right.]

Do số phương trình ít hơn số ẩn nên hệ có vô số nghiệm. Tức là, sẽ có:

  • (n-k) ẩn phụ, hay còn gọi là biến độc lập (independent/free variable): chúng đóng vai trò như tham số, mang giá trị tự do, và
  • (k) ẩn chính, hay còn gọi là biến phụ thuộc (dependent variable): giá trị của chúng sẽ được tìm theo ẩn phụ.

Gọi ({j_1, dots, j_n}) là các pivot column, khi đó ({x_{j_1}, dots, x_{j_n}}) là các ẩn chính, và những biến còn lại là ẩn phụ.

Nếu ta chuyển các ẩn phụ sang vế phải và giữ các ẩn chính vế trái, ta sẽ có một hệ con chính với (k) phương trình chính.

  • (k = n), hệ đã cho tương đương với hệ sau:

[left{begin{matrix} a_{1,1}x_1 + a_{1,2}x_2 + dots + a_{1,n}x_n & = & b_1\ a_{2,1}x_1 + a_{2,2}x_2 + dots + a_{2,n}x_n & = & b_2\ & vdots\ a_{n,1}x_1 + a_{n,2}x_2 + dots + a_{n,n}x_n & = & b_n\ end{matrix}right.]

  • (k > n) không xảy ra vì hạng của một ma trận không lớn hơn số dòng và số cột của nó.

Chú ý: Khi tìm hạng của (M), mặc dù các phép biến đổi cột cũng cho ra kết quả mong muốn, song ma trận bậc thang cuối cùng có thể không sử dụng được cho hệ phương trình. Chính vì thế, cách tốt nhất là chỉ dùng phép biến đổi sơ cấp hàng để đưa (M) về dạng bậc thang, kết luận hạng của (M), kết luận số nghiệm, sử dụng ma trận bậc thang tìm được để hình thành hệ phương trình mới (minh họa ở trên), và giải tìm nghiệm. Làm như vậy sẽ không có động tác thừa trong quá trình làm bài.