Search
Duplicate

선형대수와 군/ 행렬과 Gauss 소거법/ Matrix

집합 FF가 실수 전체의 집합 R\mathbb{R} 혹은 복소수 전체의 집합 C\mathbb{C}이고 모든 i=1,2,...,mi = 1, 2, ... , m j=1,2,...,nj = 1, 2, ... , n에 대하여 aijFa_{ij} \in F 일 때
A=(a11a12...a1na21a22...a2n............am1am2...amn)A = \left( \begin{array}{rrrr} a_{11} & a_{12} & ... & a_{1n} \\ a_{21} & a_{22} & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{m1} & a_{m2} & ... & a_{mn} \end{array} \right)
FF위의 (m×n)(m \times n) 행렬이라고 부른다.
그리고 앞 (m×n)(m \times n) 행렬 AA를 간단히는
A=(aij)m×n=(aij)A = (a_{ij})_{m \times n} = (a_{ij})
로 표기하기로 한다.
이때 aija_{ij} 를 행렬 AA(i,j)(i, j) 좌표(coordinate) 혹은 (i,j)(i, j) 성분(component)이라고 부르고
AAii 번째 행(가로줄, row)을 [A]i[A]_{i}
AAjj 번째 열(세로 줄, column)은 [A]j[A]^{j}
로 표기한다.
물론 (m×n)(m \times n) 행렬 A=(aij)A = (a_{ij})B=(bij)B = (b_{ij}) 가 같다(즉, A=BA = B)는 말은 모든 i,ji, j 에 대하여 aij=bija_{ij} = b_{ij} 라는 뜻이다.
FF위의 (m×n)(m \times n) 행렬 전체의 집합은 Mm,n(F)\mathfrak{M}_{m, n}(F)로 표기하기로 한다.
우리는 (m×n)(m \times n) 행렬 A=(aij)A = (a_{ij})B=(bij)B = (b_{ij})의 덧셈(addition)을
A+B=(aij+bij)A + B = (a_{ij} + b_{ij})
로 정의한다 (즉, A+BA + B(i,j)(i , j) 좌표가 aij+bija_{ij} + b_{ij} 라는 뜻)
행렬 A=(aij)A = (a_{ij}) 와 scalar cFc \in F 의 상수곱 (scalar multiplication)은
cA=(caij)c A = (ca_{ij})
로 정의한다.
즉, 행렬의 덧셈과 상수곱은 자연스럽게 componentwise 정의 (성분별로 정의) 된다.
그러나 행렬의 곱셉(multiplication)은 지금은 그렇게 자연스러워 보이지 않는다. 행렬 A=(aij)A = (a_{ij})의 size가 (m×n)(m \times n) 이고 행렬 B=(bjk)B = (b_{jk})의 size가 (n×r)(n \times r) 일 때, 우리는 (m×r)(m \times r) 행렬 ABAB
AB=(cik),cik=j=1naijbjkAB = (c_{ik}), c_{ik} = \sum_{j = 1}^{n} a_{ij} b_{jk}
로 정의한다.
따라서 cikc_{ik}AA의 i-th row [A]i[A]_{i}BB의 k-th column [B]k[B]^{k}의 '내적'이라고 생각할 수 있다.
행렬의 곱셉을 왜 이렇게 부자연스럽게 정의하는지를 아는 것이 이 강의 첫 목적인데, 그 본질적인 이유는 5장에서 '행렬과 선형사상은 같은 것'이라는 명제를 이해하고 나면 저절로 알게 될 것이다.
영행렬(zero matrix) 0은 모든 좌표가 0인 행렬을 뜻한다. 그리고 n-차 항등행렬(identity matrix) In=II_{n} = I(i,j)(i, j)δij\delta_{ij}(n×n)(n \times n) 정사각행렬(square matrix)을 나타내기로 한다.
(m×n)(m \times n) 행렬 A,BA, B에 대하여
A=(1)A-A = (-1) A
AB=A+(B)A - B = A + (-B)
로 표기하기로 한다.
다음 관찰은 행렬 연산의 기본적인 규칙들이다. (우리는 이미 (n×n)(n \times n) 정사각 행렬 A,BA, B 에 대하여 AB=BAAB = BA (곱셈의 교환법칙)가 언제나 성립하지는 않는다는 사실을 잘 알고 있다)

관찰 1.1.1

행렬 A,B,CA, B, C와 scalar r,sFr, s \in F 에 대하여, 연산들이 잘 정의되어 있으면 --즉, 행렬들의 size가 연산이 가능하도록 주어져 있으면-- 다음 규칙들이 성립한다.
1.
(A+B)+C=A+(B+C)(A + B) + C = A + (B + C) (덧셈의 결합법칙)
2.
A+B=B+AA + B = B + A (덧셈의 교환법칙)
3.
A+0=AA + 0 = A (뎃셈의 항등원)
4.
AA=0A - A = 0 (덧셈의 역원)
5.
(r+s)A=rA+sA(r + s)A = rA + sA (분배법칙)
6.
r(A+B)=rA+rBr(A + B) = rA + rB (분배법칙)
7.
r(sA)=(rs)Ar(sA) = (rs)A
8.
1A=A1A = A
9.
(AB)C=A(BC)(AB)C = A(BC) (곱셈의 결합법칙)
10.
AI=A=IAAI = A = IA (곱셈의 항등원)
11.
(A+B)C=AC+BC,A(B+C)=AB+AC(A+B)C = AC + BC, A(B+C) = AB + AC (분배법칙)
12.
(rA)B=r(AB)=A(rB)(rA)B = r(AB) = A(rB)
1-8항은 거의 자명하다. 예컨대 1항을 달리 표현하면 행렬의 덧셈은 componentwise 정의되었고, 각각의 component가 --즉 FF의 원소들이-- 덧셈의 결합법칙을 만족하므로, 행렬의 덧셈도 결합법칙을 만족한다고 할 수 있다.
9항의 증명도 어렵지는 않지만, 아래의 세련된 notation을 감상하기 바란다. (AB)C=A(BC)(AB)C = A(BC)를 보이는 유일한 방법은 양변의 좌표들이 모두 같음을 보이는 방법 뿐이다. 이제 행렬 AA(i,j)(i, j) 좌표를 [A]ij[A]_{ij} 로 표기하기로 하고 A=(aij),B=(bjk),C=(ckl)A = (a_{ij}), B = (b_{jk}), C = (c_{kl}) 이라 놓으면
[(AB)C]il=k[AB]ikckl=k(jaijbjk)ckl=k,j(aijbjk)ckl[(AB)C]_{il} = \sum_{k}[AB]_{ik}c_{kl} = \sum_{k}(\sum_{j} a_{ij} b_{jk})c_{kl} = \sum_{k, j} (a_{ij} b_{jk}) c_{kl}
이고 같은 방법으로
[A(BC)]il=j,kaij(bjkckl)[A(BC)]_{il} = \sum_{j,k} a_{ij}(b_{jk} c_{kl})
임을 보일 수 있다.
나머지는 연습문제로 남긴다.
(생략)

보기 1.1.3

cF,AMm,nc \in F, A \in \mathfrak{M}_{m,n}이면 당연히
(cIm)A=c(ImA)=cA(c I_{m}) A = c (I_{m} A) = cA
가 된다. 즉, 행렬 clcl는 마치 scalar와 같은 구실을 한다. 그런 의미에서 우리는 clcl 꼴의 행렬을 scalar matrix라고 한다.
또한 square matrix A 에 대하여
A2=AA,A3=AAA,A4=AAAA,...A^{2} = AA, A^{3} = AAA, A^{4} = AAAA, ...
의 표기법을 자연스럽게 해 준다.
물론
A0=I,A1=AA^{0} = I, A^{1} = A
로 정의하는 것이 우리의 관습이다.

연습문제 1.1.6

[Ar=0,(forsome)r1][A^{r} = 0, (for some) r \leq 1] 인 square matrix A를 nilpotent matrix라고 부른다.
만약 A,BMm,n(F)A, B \in \mathfrak{M}_{m,n}(F) 가 nilpotent이고 AB=BAAB = BA 이면 (A+B)(A+B)도 nilpotent임을 보여라

연습문제 1.1.7

A=(aij)A = (a_{ij})가 square matrix일 때, 만약 [aij=0,(if)i>j][a_{ij} = 0, (if) i > j] 이면 A를 upper-triangular matrix라고 부른다.
또 이때 [aii=0,i][a_{ii} = 0, \forall i] 이면 A를 strictly upper-triangular matrix라고 부르고, [aii=1,i][a_{ii} = 1, \forall i] 이면 A를 unipotent upper-triangular matrix라고 부른다.
(가) A,BMn,n(F)A, B \in \mathfrak{M}_{n,n}(F) 가 upper-triangular이면 AB도 upper-triangular임을 보여라. 이때 AB의 대각성분을 묘사하라
(나) A,BMn,n(F)A, B \in \mathfrak{M}_{n,n}(F) 가 strictly upper-triangular 이면 AB도 strictly upper-triangular임을 보여라. 또 A,BMm,n(F)A, B \in \mathfrak{M}_{m,n}(F) 가 unipotent upper-triangular이면 AB도 unipotent upper-triangular임을 보여라
(다) AMn,n(F)A \in \mathfrak{M}_{n,n}(F) 가 strictly upper-triangular이면 An=0A^{n} = 0 임을 보여라
A=(aij)A = (a_{ij})(m×n)(m \times n)- matrix라고 할 때, (n×m)(n \times m)-matrix At=(aji)A^{t} = (a_{ji})를 A의 전치행렬 (transpose matrix)라고 부른다. 즉 AtA^{t}(i,j)(i, j)-좌표가 ajia_{ji}라는 뜻이다. 따라서 AtA^{t}AA의 행은 열로, 열은 행으로 바꾼 행렬이다.
예컨대
(123456)t=(142536)\left( \begin{array}{rrr} 1 & 2 & 3 \\ 4 & 5 & 6 \end{array} \right)^{t} = \left( \begin{array}{rrr} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{array} \right)
이 된다.
이제 A=AtA = A^{t} 인 matrix AA 를 대칭행렬(symmetric matrix)라고 부르는 것 또한 매우 자연스럽다. 또 X,YX, Y(n×1)(n \times 1)-행렬일 때, XtYX^{t} \cdot Y는 vector의 '내적'이고, XYtX \cdot Y^{t}(n×n)(n \times n)-행렬임을 확인할 수 있다.
A,BMm,n(F),CMn,r(F),cFA, B \in \mathfrak{M}_{m,n}(F), C \in \mathfrak{M}_{n, r}(F), c \in F 일 때 다음을 보여라
(A+B)t=At+Bt(A+B)^{t} = A^{t} + B^{t}
(cA)t=cAt(cA)^{t} = cA^{t}
(At)t=A(A^{t})^{t} = A
(AC)t=CtAt(AC)^{t} = C^{t} A^{t}

정의 1.1.9

(n×n)(n \times n)-square matrix A=(aij)A = (a_{ij})에 대하여
tr(A)=i=1naiitr(A) = \sum_{i=1}^{n} a_{ii}
를 표기하고 tr(A)tr(A)의 행렬을 행렬 AA의 trace라고 부른다. 즉 AA의 trace는 AA의 대각성분(diagonal component)들의 합이다.
tr(123456789)=1+5+9=15tr \left( \begin{array}{rrr} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{array} \right) = 1 + 5 + 9 = 15

연습문제 1.1.11

(n×n)(n \times n) 행렬 A,BA, B와 scalar cFc\in F에 대하여 다음이 성립하는 것을 보여라
tr(A+B)=tr(A)+tr(B)tr(A + B) = tr(A) + tr(B)
tr(cA)=ctr(A)tr(cA) = c \cdot tr(A)
tr(At)=tr(A)tr(A^{t}) = tr(A)
tr(AB)=tr(BA)tr(AB) = tr(BA)
Square matrix가 아니면 diagonal component라는 말이 의미가 없으므로, trace는 square matrix의 경우에만 의미를 갖는다. 독자들은 trace라는 단어의 뜻에 유의하기 바란다. n2n^{2}개의 component를 데리고 지나간 발자국(흔적)이 고작 nn개 diagonal component의 합이라니!
우리는 뒤에서 trace의 중요성을 배우기 시작할 것이다. 사실 독자들은 이미 행렬 A=(abcd)A = \left( \begin{array}{rr} a & b \\ c & d \end{array} \right) 는 항상
A2(a+d)A+(adbc)I=0A^{2} - (a + d) A + (ad - bc) I = 0
을 만족시킨다는 것을 배운적이 있을 것이다. (2×22 \times 2) 행렬의 Cayley-Hamilton Theorem)
위 항등식의 1-차항의 계수 (a+d)(a + d)가 바로 tr(A)tr(A)이다.
그렇다면 상수항의 계수 (adbc)(ad - bc)는? 우리는 뒤에 6장에서 (adbc)(ad - bc)AA의 determinant라고 부르게 된다. 무엇을 결정해 준다는 뜻일까? 독자들은 이미 (adbc)(ad - bc)가 역행렬과 관련이 있다는 것을 알고 있을 것이다.
그리고 독자들은 이미 앞의 관찰 1.1.1에서 곱셈의 역원이 항상 존재하지는 않는다는 것을 눈치챘을 것이다. 다음 정의는 고등학교에서 배운 익숙한 것이다.

정의 1.1.14

Square matrix AMn,n(F)A \in \mathfrak{M}_{n, n}(F)에 대하여
AB=In=BAAB = I_{n} = BA
BMn,n(F)B \in \mathfrak{M}_{n, n}(F)가 존재하면, 우리는 AA를 가역행렬(invertible matrix)라고 부른다. 이때 BBAA의 역행렬(inverse matrix)라고 부르고 B=A1B = A^{-1}로 표기한다.
위에서 A1A^{-1}의 표기법을 사용하고 'the inverse of A'라고 부르려면 AA의 역행렬은 (존재한다면) 하나 뿐임을 보여야하는 것은 당연하다. (독자들은 역행렬을 정의하자마자 이렇게 생각하도록 훈련하여야 한다)

관찰 1.1.15

Invertible matrix AMn,n(F)A \in \mathfrak{M}_{n, n}(F)의 inverse는 유일하다.

증명

BMn,n(F)B \in \mathfrak{M}_{n, n}(F)를 위 정의에서와 같다고 하자. 우리는
AC=I=CAAC = I = CA
CMn,n(F)C \in \mathfrak{M}_{n, n}(F)가 또 있다고 가정하고, B=CB = C 인 것을 보이면 된다. 이제 BACBAC를 생각하면
B=BI=B(AC)=(BA)C=IC=CB = BI = B(AC) = (BA)C = IC = C
이므로 증명이 끝난다.
우리는 고교때 2×22 \times 2- 행렬 A=(abcd)A = \left( \begin{array}{rr} a & b \\ c & d \end{array} \right)가 가역일 필요충분조건이
adbc0ad - bc \neq 0
이고 이때 AA의 역행렬은
A1=1adbc(dcba)A^{-1} = {1 \over ad - bc} \left( \begin{array}{rr} d & -c \\ -b & a \end{array} \right)
인 것을 알고 있다. 이를 모든 n×nn \times n- 행렬의 경우로 확장하는 것도 이 책 전반부의 목표 가운데 하나이다.
다음은 가역행렬의 (초보적인) 성질들이다.
가역행렬 A,BMn,n(F)A, B \in \mathfrak{M}_{n, n}(F)scalar0cF\text{scalar} 0 \neq c \in F에 대하여 다음이 성립하는 것을 보여라
1.
II는 가역이고 I1=II^{-1} = I
2.
cAcA는 가역이고 (cA)1=1cA1(cA)^{-1} = {1 \over c} A^{-1}
3.
ABAB도 가역이고 (AB)1=B1A1(AB)^{-1} = B^{-1}A^{-1}
4.
A1A^{-1}도 가역이고 (A1)1)=A(A^{-1})^{-1}) = A
5.
AtA^{t}도 가역이고 (At)1=(A1)t(A^{t})^{-1} = (A^{-1})^{t}

연습문제 1.1.18

O(n)={AMn,n(RA is invertible andA1=At}O(n) = \{ A \in \mathfrak{M}_{n, n}(\mathbb{R} | A \textrm{ is invertible and} A^{-1} = A^{t} \} 로 정의할 때 다음을 보여라.
1.
InO(n) I_{n} \in O(n)
2.
A,BO(n)A, B \in O(n) 이면 ABO(n)AB \in O(n)
3.
AO(n)A \in O(n) 이면 A1O(n)A^{-1} \in O(n)
4.
AO(n)A \in O(n) 이면 AtO(n)A^{t} \in O(n)

연습문제 1.1.19

A,UMn,n(F)A, U \in \mathfrak{M}_{n, n}(F)이고 UU가 가역이면
tr(U1AU)=tr(A)tr(U^{-1}AU) = tr(A)
임을 보여라

연습문제 1.1.20

(가) A,UMn,n(F)A, U \in \mathfrak{M}_{n, n}(F)이고 UU가 가역일 때, m0m \geq 0 이면
(U1AU)m=U1AmU(U^{-1}AU)^{m} = U^{-1}A^{m}U
임을 보여라
(나) A,UMn,n(F)A, U \in \mathfrak{M}_{n, n}(F) 이고 UU가 가역일 때, 만약 AA가 nilpotent이면 UT1AUUT{-1}AU도 nilpotent 임을 보여라
위 연습문제는 가장 '예쁜' 행렬이 --즉, 가장 다루기 쉬운 행렬이-- 대각 행렬(diagonal matrix) 임을 보여주고 있다.

연습문제 1.1.21

AMn,n(F)A \in \mathfrak{M}_{n, n}(F) 일 때 (단, i=1,...,ki = 1, ... , k), n1+...+nk=nn_{1} + ... + n_{k} = n 이라고 놓자. 우리는 다음
A=diag(A1,...Ak)=(A1A20..0.Ak)Mn,n(F)A = diag(A_{1}, ... A_{k}) = \left( \begin{array}{rrrrrr} A_{1} & & & & & \\ & A_{2} & & & 0 & \\ & & . & & & \\ & & & . & & \\ & 0 & & & . & \\ & & & & & A_{k} \end{array} \right) \in \mathfrak{M}_{n, n}(F)
형태의 행렬을 (AiA_{i} 를 i-th diagonal block으로 갖는) block diagonal matrix라고 부른다. Ai,BiMni,ni(F)A_{i}, B_{i} \in \mathfrak{M}_{n_{i}, n_{i}}(F) 일 때 다음을 보여라.
1.
diag(A1,...,Ak)diag(B1,...,Bk)=diag(A1B1,...,AkBk)diag(A_{1}, ... , A_{k}) \cdot diag(B_{1}, ... , B_{k}) = diag(A_{1}B_{1}, ... , A_{k}B_{k})
2.
AiA_{i} 가 가역이면, (diag(A1,...,Ak))1=diag(A11,...,Ak1)(diag(A_{1}, ... , A_{k}))^{-1} = diag(A_{1}^{-1}, ... , A_{k}^{-1})
우리는 고교시절 3×33 \times 3- 행렬 AA의 역행렬을 구하는 연습문제를 풀어 본 경험이 있다. 그때 미지수가 3개인 1차 연립방정식을 세 개 풀어서 AB=IAB = I3×33 \times 3-행렬 BB를 구하면 어쩐 일인지 항상 BA=IBA = I가 저절로 성립했던 경험이 있을 것이다.

질문 1.1.22

A,BMn,n(F)A, B \in \mathfrak{M}_{n, n}(F) 일 때 AB=IAB = I 이면 항상 BA=IBA = I 인가?
고등학교 수학 책과 대부분의 미적분학 책에서는 이 질문을 고의적으로 숨기고 있다. 따라서 우리의 질문 1.1.22가 '대학교 선형대수학'의 출발점이 된다.
우리는 뒤에서 이 답이 '예' 임을 배우가 되는데, 지금 단계에서는 이 질문에 답하는 것의 불가능하기 때문에 10분 이상 투자하지 않기 바란다.

연습문제 1.1.23

A,BMn,n(F)A, B \in \mathfrak{M}_{n, n}(F) 일 때 AB=0AB = 0 이면 항상 BA=0BA = 0인가?