수학/ 기초 미분 연산

미분 기호

도함수(Derivative)

상수 미분

편미분(Partial Derivative)

전미분(Total Derivative)

미분(Differential)은 도함수(Derivative)를 구하는 과정을 의미한다. 여기서 도함수는 함수의 입력 값의 차이에 대한 출력 값의 차이의 민감도를 측정하는 방법으로 그 결과를 변화율이나 기울기로 이해할 수 있다.

도함수가 연속인 경우에만 존재하므로 미분은 연속인 경우에만 정의가 되며, 이산인 경우에는 차분(Difference)이라는 방법을 이용한다. 미분을 통해 구한 변화율을 적분하면 변화량이 되지만, 차분은 변화율을 구할 수 없는 대신 변화량을 직접 정의한다.

미분 기호

함수

f

에 대한 미분 기호는 다음과 같다. 분자에는 미분할 대상, 분모에는 그 대상 안의 실제 미분할 매개변수라고 이해하면 쉽다.

f' = {d \over dx}(f) = {d \over dx} f = {df \over dx} = {d \over dx}(y) = {d \over dx}y = {dy \over dx}

미분을 2번 하는 경우 다음과 같이 표시한다. 이것을 일반화 시키면

n

번에 대해 표기 가능하다.

f'' = {d^2 \over dx^2}(f) = {d^2 \over dx^2} f = {d^2 f \over dx^2} = {d^2 \over dx^2}(y) = {d^2 \over dx^2}y = {d^2 y \over dx^2}

일반적으로 미분을 나타내는 식

{df \over dx}

에서

dx

는

x

로 함수

f

를 미분한다는 표기일 뿐이지만, 경우에 따라

dx

를

x

에 대한 미소변화량을 나타내는 변수로 생각해도 타당하다. 이것은 다음이 성립한다는 뜻이다. 이 경우 함수

f(x)

를

x

에 대한 미소변화량

dx

로 나눈다는 의미가 된다. 이는 점

x

에서의 미분이 해당 점에서의 기울기를 의미한다는 점에서 타당하다.

{df(x) \over dx} = g(x) \Rightarrow df(x) = g(x)dx

이것은 적분에 대해서도 비슷한 개념으로 적용할 수 있다. 다시 말해 아래의 적분은 구간

[-\infty, \infty]

에 걸쳐 함수

f(x)

에

x

의 미소변화량

dx

를 곱한 것을 모두 합한다는 의미로 생각할 수 있다. 이는 애초에 적분이 구간에 걸쳐 미소한 양으로 쪼갠 뒤 그것을 모두 합한다는 의미에서 볼 때 타당하다.

\int_{-\infty}^{\infty} f(x) dx

미분과 적분은 서로의 역연산임에 주의. 즉 미분 결과를 적분하면 원래의 형태(부정적분인 경우

+ C

가 더해진)가 되고, 거꾸로 적분한 것을 다시 미분하면 원래의 형태가 된다.

도함수(Derivative)

도함수는 특정 점에서의 순간 변화율을 나타내며, 아래와 같이 2가지 형태로 정의 가능하다.

우선

x

가 어떤 점

a

에 가까워질 때 점

a

에 대한 미분 계수는 아래와 같이 정의된다.

f'(a) = \lim_{x\to a} {f(x)-f(a)\over x-a}

반면 점

x

에서의 미분계수는 아래처럼 표현할 수 도 있다.

f'(x) = \lim_{h\to0} {f(x+h)-f(x)\over h}

이 형태가 일반적으로 더 많이 사용된다. 구간을

h

대신

2h

나

{1\over2}h

를 사용한다면 다음과 같이 나타낼 수 있다.

\begin{aligned} \lim_{h\to0} {f(x+2h)-f(x)\over 2h} &= \lim_{k\to0}{f(x+k)-f(x)\over k} = f'(x) \quad (k= 2h) \\ \lim_{h\to0} {f(x+{1\over2}h)-f(x)\over {1\over2}h} &= \lim_{k\to0}{f(x+k)-f(x)\over k} = f'(x) \quad \left(k= {1\over2}h\right) \end{aligned}

즉

x

에 더해지는 크기와 동일한 크기로 차이를 나누면

f'(x)

가 된다.

이를 이용하여

f(x+2h)

와

f(x+h)

사이의 변화량을 다음과 같이 정리할 수 있다.

\begin{aligned} \lim_{h\to0} {f(x+2h)-f(x+h)\over h} &= \lim_{h\to0}{f(x+2h)-f(x)-f(x+h)+f(x)\over h} \\&= \lim_{h\to0}\left({f(x+2h)-f(x)\over h}-{f(x+h)-f(x)\over h}\right) \\ &= \lim_{h\to0}2{f(x+2h)-f(x)\over 2h}-\lim_{h\to0}{f(x+h)-f(x)\over h} \\ &= 2f'(x)-f'(x) = f'(x) \end{aligned}

상수 미분

상수를 미분하면 0이 된다.

{d \over dx}(c) = 0

거듭제곱 미분

이는 역수나 제곱근에서도 동일하게 적용할 수 있다.

\begin{aligned} {d \over dx} (x^n) &= n x^{n-1}\\ {d \over dx} {1 \over x^2} &= {d \over dx} x^{-2} = -2x^{-3} = -{2 \over x^3} \\ {d \over dx} \sqrt{x} &= {d \over dx} x^{1 \over 2} = {1 \over 2}x^{-{1 \over 2}} \end{aligned}

상수가 곱해진 경우는 상수를 미분 연산 밖으로 뺀 후에 계산한다. 이것은 이하 모든 미분 연산에 대해 동일하므로 이후에는 생략.

{d \over dx} (2x^n) = 2\cdot{d \over dx} (x^n) = 2 \cdot n x^{n-1}

지수 미분

\begin{aligned} {d \over dx} a^x &= a^x \log_e a = a^x \ln a \ (a > 0) \\ {d \over dx} e^x &= e^x \log_e e = e^x \end{aligned}

로그 미분

\begin{aligned} {d \over dx}(\log_a x) &= {1 \over x \log_e a} = {1 \over x \ln a} \\ {d \over dx} (\log_e x) &= {1 \over x \log_e e} = {1 \over x} \end{aligned}

이를 일반화하면 아래와 같다. 이에 대한 유도는 아래 연쇄 법칙 부분 참조.

{d\over dx}\ln (f(x)) = {f'(x)\over f(x)}

삼각함수 미분

\begin{aligned} {d \over dx} (\sin x) &= \cos x \\ {d \over dx} (\cos x) &= -\sin x \\ {d \over dx} (\tan x) &= \sec^2 x \\ {d \over dx} (\cot x) &= -\csc^2 x \\ {d \over dx} (\sec x) &= \sec x \cdot \tan x \\ {d \over dx} (\csc x) &= -\csc x \cdot \cot x \end{aligned}

미분함수 연산

두 함수

f, g

와 상수

c

에 대해 다음의 미분 연산이 성립한다.

\begin{aligned} {d \over dx}(cf + g) &= c\cdot {df \over dx} + {dg \over dx} \\ {d \over dx}(f \cdot g) &= {df \over dx} \cdot g + f \cdot {dg \over dx} \\ {d \over dx} \left( { f\over g} \right) &= {f'(x)g(x) - f(x)g'(x) \over g(x)^2}\end{aligned}

곱의 미분에 대해, 함수가 3개인 경우 아래와 같이 미분되고

{d\over dx}(f\cdot g\cdot h) = \left({df\over dx}\right)g\cdot h + f\left({dg\over dx}\right)h + f\cdot g\left({dh\over dx}\right)

따라서

n

개 함수에 대한 곱의 미분은 아래와 같다.

{d\over dx}(f_1\cdot f_2\cdot...\cdot f_n)= \sum_{k=1}^n f_1\cdot f_2\cdot ... \cdot \left({d f_k\over dx}\right) \cdot... \cdot f_n

편미분(Partial Derivative)

2개의 매개변수를 받는 함수

f(x, y)

에 대해 편미분은 다음과 같이 표기한다.

\begin{aligned} f_x(x, y) &= {\partial f \over \partial x} \\ f_y(x, y) &= {\partial f \over \partial y} \end{aligned}

편미분을 2번 할 때는 편미분하는 순서에 따라 다음과 같이 표기한다. 함수 아래첨자는 왼쪽이 먼저하는 것이고, 미분 표기법에서는 오른쪽이 먼저 하는 것이다. 이것을 일반화 시키면

n

번 편미분하는 것에 대해 표기 가능하다.

\begin{aligned} f_{xx}(x, y) &= {\partial^2 f \over \partial x^2} \\ f_{yy}(x, y) &= {\partial^2 f \over \partial y^2} \\ f_{xy}(x, y) &= {\partial^2 f \over \partial y \partial x} \\ f_{yx}(x, y) &= {\partial^2 f \over \partial x \partial y} \end{aligned}

참고로 편미분을 각각 다른 매개변수로 할 때, 그 순서와 관계 없이 결과가 같아지는데, —위의 예시에서

x

를 먼저하고

y

를 다음에 하는 것이나,

y

를 먼저하고

x

를 다음에 하는 것이나 결과가 같다— 이를 슈와르츠 정리(Schwarz’s theorem)라고 한다. 편미분을 하면 다른 매개변수는 상수 취급이 되서 다 날아가기 때문에 어느 것을 먼저하든 상관 없다.

전미분(Total Derivative)

전미분은 각 매개변수의 미소변화량에 따라 함수가 어떻게 변하는지를 나타내는 개념으로, 다른 매개변수를 상수로 취급하는 편미분과 달리 각 매개변수에 대해 개별적으로 편미분을 하고 하나의 함수로 나타낸다. 예컨대 2개의 매개변수를 받는 함수

f(x, y)

에 대해 전미분은 다음과 같이 표기한다. 각각의 매개변수에 대해 미소 변화량이 곱해지는 것에 유의.

df = {\partial f \over \partial x}dx + {\partial f \over \partial y}dy

함수

f(x, y) = x^2 + y^2

에 대한 전미분은 다음과 같이 계산된다.

dx, dy

가 각각 곱해지는 것에 주의

df = 2xdx + 2ydy

연쇄 법칙(Chain Rule)

합성함수에 대해 미분할 때 Chain Rule이 적용된다.

\begin{aligned} f(x) &= h(g(x)) \\ {df \over dx} &= {dh \over dg} \cdot {dg \over dx} \end{aligned}

일반적으로 log 함수가 내부에 식을 갖고 있다면 내부의 식을 치환한 후 합성 함수로 풀어야 한다.

f(x) = \ln (ax + b)

를 미분할 때,

g(x) = ax + b

로 치환하여

h(x) = \ln g(x)

로 놓고 연쇄법칙으로 계산한다.

\begin{aligned} {d \over dx} \ln(ax+b) &= {d \over dg} h(x) \cdot {d \over dx}g(x) \\&= {d \over dg} \ln (ax+b) \cdot {d \over dx} (ax+b) \\&= {1 \over ax+b} \cdot a \end{aligned}

결론적으로 이런 형식이 된다.

{d\over dx} \ln f(x) = {1\over f(x)} \cdot f'(x) = {f'(x) \over f(x)}

위 식을 변형하면 이렇게 작성할 수 있다.

f'(x) = f(x) \cdot \ln f(x)

이건 지수 함수에 대해서도 마찬가지로 적용한다.

f(x) = e^{ax + b}

를 미분할 때,

g(x) = ax + b

로 치환하여

h(x) = e^{g(x)}

로 놓고 연쇄법칙으로 계산한다. 일반적으로 지수로 올리면 표기가 잘 안보이기 때문에

e^{ax+b} = \exp(ax+b)

로 표기한다.

\begin{aligned} {d \over dx} e^{ax+b} &= {d \over dg} h(x) \cdot {d \over dx}g(x) \\&= {d \over dg} \exp (ax+b) \cdot {d \over dx} (ax+b) \\&= \exp(ax+b) \cdot a \end{aligned}

결론적으로 이런 형식이 된다.

{d\over dx}e^{f(x)} = e^{f(x)} \cdot f'(x)

거듭제곱 함수와 연쇄법칙

어떠한 함수

f(x)

에 대한 거듭제곱 형태

(f(x))^n

도 함수 합성이라고 보고 미분을 구할 때 연쇄법칙을 사용하여 아래처럼 구한다.

{d\over dx}(f(x))^n = n(f(x))^{n-1}\cdot f'(x)

예컨대

\sin^3x = (\sin x)^3

(삼각함수의 경우

\sin^n x = (\sin x)^n

과 동일한 의미이다.)에 대해 미분을 수행하면 연쇄법칙을 적용하여 아래처럼 계산된다.

{d\over dx}(\sin x)^3 = 3(\sin x)^2 \cdot(\sin x)' = 3(\sin x)^2\cdot \cos x = 3\sin^2 x\cdot\cos x

유사하게

{1\over f(x)} = f(x)^{-1}

이므로 아래처럼 계산된다.

{d\over dx}{1\over f(x)} = (f(x)^{-1})'\cdot f'(x) = -f(x)^{-2}\cdot f'(x) = -{f'(x)\over f(x)^2}

또한

\sqrt{f(x)} = f^{1\over2}(x)

이므로 아래처럼 계산된다.

{d\over dx}\sqrt{f(x)} = (f(x)^{1\over2})'\cdot f'(x) = {1\over2}f(x)^{-{1\over2}}\cdot f'(x) = {f'(x)\over2\sqrt{f(x)}}

다변수함수와 연쇄법칙

다변수함수의 미분을 구할 때도 함수가 연결되어 있으면 연쇄법칙이 적용된다. 예컨대 변수

x

를 입력으로 가지는 함수가

f_1, f_2, ... , f_n

과 같이

n

개가 있고 각각의 출력을

y_1, y_2, ... , y_n

이라고 하자.

\begin{aligned} y_1 &= f_1(x) \\ y_2 &= f_2(x) \\ ... \\ y_n &= f_n(x) \end{aligned}

그리고 이

y_1, y_2, ... , y_n

값에 의존하는 다른 함수

g

가 있다고 하자.

g

의 출력은

z

라고 한다.

z = g(y_1, y_2, ... , y_n)

이때 변수

x

값의 변화에 따른

z

값의 변화는 다음처럼 계산한다.

{dz \over dx} = {\partial z \over \partial y_1} {d y_1 \over dx} + {\partial z \over \partial y_2} {d y_2 \over dx} + ... + {\partial z \over \partial y_n} {d y_n \over dx}

이번에는 함수

f_1, f_2, ... , f_n

이

x_1, x_2, ... , x_m

을 입력으로 가지는 다변수함수라고 하자.

\begin{aligned} y_1 &= f_1(x_1, x_2, ... , x_m) \\ y_2 &= f_2(x_1, x_2, ... , x_m) \\ ... \\ y_n &= f_n(x_1, x_2, ... , x_m)\end{aligned}

이때의 변수

x

값의 변화에 따른

x

값의 변화도 마찬가지로 계산할 수 있다.

\begin{aligned} {dz \over dx_1} &= {\partial z \over \partial y_1} {d y_1 \over dx_1} + {\partial z \over \partial y_2} {d y_2 \over dx_1} + ... + {\partial z \over \partial y_n} {d y_n \over dx_1} \\ {dz \over dx_2} &= {\partial z \over \partial y_1} {d y_1 \over dx_2} + {\partial z \over \partial y_2} {d y_2 \over dx_2} + ... + {\partial z \over \partial y_n} {d y_n \over dx_2} \\ ... \\ {dz \over dx_m} &= {\partial z \over \partial y_1} {d y_1 \over dx_m} + {\partial z \over \partial y_2} {d y_2 \over dx_m} + ... + {\partial z \over \partial y_n} {d y_n \over dx_m} \end{aligned}

역함수 정리

f

의 역함수

g = f^{-1}

에 대해 도함수는 다음과 같이 정리할 수 있다.

{d\over dy}g(y) = {1\over {d\over dx} f(x)}

이것을 간단하게 아래처럼 표현 가능하다.

{dx\over dy} = {1\over {dy\over dx}}

추가로

g

의 2계 도함수는 위의 식에 대해 양변을

y

로 한 번 더 미분한 형태로 체인룰을 이용하여 다음과 같이 정리된다.

\begin{aligned} {d^2\over dy}g(y) = {d\over dy}\left({1\over {d\over dx} f(x)}\right) = {dx\over dy}\cdot{d\over dx}\left({1\over f'(x)}\right)={1\over f'(x)}\cdot\left(-{f''(x)\over (f'(x))^2}\right) = -{f''(x)\over (f'(x))^3} \end{aligned}

여기서

{dx\over dy} = {1\over f'(x)}

이고

{d\over dx}\left({1\over f'(x)}\right) ={d\over dx} f'(x)^{-1} = -f'(x)^{-2} \cdot f''(x) = -{f''(x)\over (f'(x))^2}

이다.