Search
Duplicate

확률, 통계/ 적률(Moments) - 기댓값, 분산, 왜도, 첨도

적률(Moments)

적률은 수학에서 함수의 모양을 표현하는 척도로 다음과 같이 정의 됨. 이 개념이 물리학이나 통계에서도 사용 됨.
통계의 경우 평균, 분산, 왜도, 첨도 등이 적률이나 아래의 중심 적률, 표준화 적률 등을 이용해서 유도된다.
μn(xc)nf(x)dx\mu_n \triangleq \int_{-\infty}^{\infty} (x-c)^n f(x) dx
통계와 물리학에서 쓰이는 moment는 미묘하게 다르긴 하지만 기본적으로 물체나 분포에 대한 특성을 나타내는 값이라고 볼 수 있음.
1차 모멘트는 정적 모멘트 또는 중심이라고 하며 물체의 질량 중심을 나타내는데, 때문에 통계에서는 평균에 대응됨.
2차 모멘트는 관성 모멘트 또는 회전 관성이라고 하며, 물체가 회전에 얼마나 저항하는지를 나타냄. 이것은 회전축에 대한 물체의 분포를 나타내기 때문에 통계에서는 분산에 대응됨.
3차 모멘트는 기울어진 모멘트, 비대칭성이라고 하며 물체의 모양이 얼마나 비대칭적인지를 나타냄. 때문에 통계에서는 왜도(skewness)에 대응됨.

통계에서의 적률

통계에서는 적률은 위 식에 c=0c = 0을 대입하여 정의한다. 그리고 이것을 μ\mu'을 써서 표기한다.
μnxnf(x)dx\mu_n' \triangleq \int_{-\infty}^{\infty} x^n f(x) dx

중심 적률

통계에서 중심 적률은 수학의 적률과 유사한데, c=μc = \mu를 써서 표기한다. μ\mu는 평균값.
μn(xμ)nf(x)dx\mu_n \triangleq \int_{-\infty}^{\infty} (x-\mu)^n f(x) dx

표준화 적률

통계에서 표준화 적률은 다음과 같이 정의된다. μ\mu는 평균이고 σ\sigma는 표준편차. 표준화 적률은 μ~\tilde{\mu}로 표기한다.
μ~nμnσn\tilde{\mu}_n \triangleq {\mu_n \over \sigma^n}

적률 생성 함수

적률 생성 함수(Moment Generating Function, MGF)는 말 그대로 적률을 생성하는 함수이다. 적률 생성 함수는 다음과 같이 정의 된다.
MX(t)E[etX]M_X(t) \triangleq \mathbb{E}[e^{tX}]
위 식의 etXe^{tX}를 테일러 전개한 후, 1번 미분하면 1차 적률 E[X]E[X]이 만들어지고, 2번 미분하면 2차 적률 E[X2]E[X^2]이 만들어지고, nn번 미분하면 nn차 적률 E[Xn]E[X^n]이 만들어진다.
실제 전개에 대해서는 참고의 링크 참조.

분포의 적률

기댓값(expected value), 평균(mean)

분포의 기댓값(또는 평균)은 다음과 같이 정의 된다.
평균은 1차 적률에서 유도 가능하다.
이산 확률의 경우
여기서 xx는 집합 XX내의 원소의 값이고, p(x)p(x)는 그 원소에 대한 확률이다.
원소에 대해 원소의 확률을 곱한 것을 모두 합하면 이산 확률의 기대값이 된다.
E[X]xXxp(x)\mathbb{E}[X] \triangleq \sum_{x \in X} x p(x)
연속 확률의 경우
기본 개념은 이산인 경우와 같지만, 연속인 경우 더하기(sum)가 성립하지 않기 때문에, 적분을 이용한다.
E[X]Xxp(x)dx\mathbb{E}[X] \triangleq \int_X x p(x) dx

분산(variance)

분산은 분포의 퍼진 정도를 측정하는 개념으로 다음과 같이 정의 된다. (아래 식에서 μ\mu는 평균을 의미)
분산은 2차 중심 적률에서 유도 가능하다.
V[X]E[(Xμ)2]=E[X2](E[X])2\mathbb{V}[X] \triangleq \mathbb{E}[(X - \mu)^2] = \mathbb{E}[X^2] - (\mathbb{E}[X])^2
분산은 σ2\sigma^2으로 표현되는데, 여기서 σ\sigma는 표준편차를 의미한다.

왜도(Skewness)

왜도는 분포의 비대칭도를 측정하는 개념으로 다음과 같이 정의 된다. (아래 식에서 μ\mu는 평균을 의미)
왜도는 3차 표준화 적률에서 유도 가능하다.
g1=n(n1)(n2)i=1n(xiμσ)3g_1 = {n \over (n-1)(n-2)} \sum_{i=1}^{n} \left( {x_i - \mu \over \sigma} \right)^3

첨도(Kurtosis)

첨도는 분포의 뾰족함을 측정하는 개념으로 다음과 같이 정의 된다.
첨도는 4차 표준화 적률에서 유도 가능하다.
g2=n(n+1)(n1)(n2)(n3)i=1n(xiμσ)43(n1)2(n2)(n3)g_2 = {n(n+1) \over (n-1)(n-2)(n-3)} \sum_{i=1}^{n} \left( {x_i - \mu \over \sigma} \right)^4 - {3(n-1)^2 \over (n-2)(n-3)}

참고