Search
Duplicate

확률, 통계/ 귀무-대립 가설, Type I-II Error

귀무가설(null hypothesis), 대립가설(alternative hypothesis)

귀무가설과 대립가설 중 어느 것이 사실과 가까운지 검증하는 것을 가설 검증(hypothesis testing)이라고 한다. 이것은 이진 분류 문제로 생각할 수 있다.
일반적으로 귀무가설(또는 영가설)은 기각을 가정하고 세워진 가설이고, 대립가설은 연구자가 입증하려고 하는 가설을 의미한다. 이는 무엇인가가 참인 것을 입증하기는 어렵지만, 거짓인 것을 입증하기는 쉽기 때문에 만들어진 구조이다.
1.
연구자는 자신이 주장하고자 하지만 참임을 직접 증명하기는 어려운 가설을 대립가설로 설정한다.
2.
그와 반대 되면서, 거짓임을 입증하기 쉬운 가설을 귀무가설로 정의한다.
3.
우선 귀무가설이 참이라는 것에서 분석을 시작한다.
4.
검정 통계를 거쳐 귀무가설이 거짓임을 밝힌다.
5.
최종적으로 귀무가설을 기각하고, 이에 반대되는 대립가설을 채택한다.
주의할 점은 귀무가설을 기각하지 못했다고, 귀무가설이 참이라는 뜻이 되는게 아니고 —참임을 증명하는 것은 어렵다— 귀무가설이 기각되었다고 대립 가설이 참이 되는 것도 아니다. —마찬가지로 참임을 증명하기는 어렵다— 다만 대립 가설이 귀무가설보다 더 가능성이 높다고 주장하는 것이다.
귀무 가설을 M0M_0과 대립 가설을 M1M_1 이라 하고 0-1 손실을 사용할 때, 최적의 결정은 p(M1D)>p(M0D)p(M_1|\mathcal{D}) > p(M_0|\mathcal{D}) 또는 p(M1D)/p(M0D)>1p(M_1|\mathcal{D})/ p(M_0|\mathcal{D}) > 1인 대립 가설을 고르는 것이다.
가설이기 때문에 귀무 가설을 H0H_0, 대립 가설을 H1H_1 또는 HaH_a이라고도 표기한다.

Type I Error

가설 검정에서 Type I Error는 귀무가설 H0H_0이 참인데, 기각하는 것을 말한다. 이것은 False-Negative에 해당한다.
Type I 오류는 α\alpha 오류라고도 하며, 검정의 유의 수준(significance level)을 나타낸다. 다음처럼 계산한다.
아래의 식에서 μ0\mu_0은 귀무가설 모집단의 평균을 나타내고,
D~\tilde{\mathcal{D}}는 샘플 데이터를 의미하고, Xˉ(D~)\bar{X}(\tilde{\mathcal{D}})는 샘플 데이터의 표본 평균을 나타낸다.
D~H0\tilde{\mathcal{D}} \sim H_0은 샘플 데이터 D~\tilde{\mathcal{D}}가 귀무 가설 H0H_0에서 왔다고 가정하는 것을 의미한다.
σ\sigma는 모집단의 표준 편차, NN은 표본의 크기로 xˉμ0σ/N{\bar{x} - \mu_0 \over \sigma / \sqrt{N}}은 표준화된 표본 평균을 나타낸다.
xx^*는 임계값(critical value)로 이 임계값을 기준으로 귀무가설을 기각할지 아닐지 결정한다.
α(μ0)=p(Xˉ(D~)>xD~H0)=p(Xˉμ0σ/N>xμ0σ/N)\alpha(\mu_0) = p(\bar{X}(\tilde{\mathcal{D}}) > x^*|\tilde{\mathcal{D}} \sim H_0) = p \left( {\bar{X} - \mu_0 \over \sigma / \sqrt{N}} > {x^* - \mu_0 \over \sigma / \sqrt{N}} \right)
이 식은 결국 귀무가설이 참일 때 (즉 데이터가 H0H_0에서 왔다고 가정할 때), 주어진 임계값 xx^*보다 큰 표본 평균을 관측할 확률을 나타낸다.
임계값은 x=zασ/N+μ0x^* = z_\alpha \sigma / \sqrt{N} + \mu_0로 주어는데, 여기서 zαz_\alpha는 표준 정규 분포의 상위 α\alpha 분위수이다

Type II Error

반면 Type II 에러는 대립가설 H1H_1이 참일 때 귀무를 채택하는 것을 말한다. 이것은 False-Positive에 해당한다.
Type II 에러는 β\beta 오류라고도 하며, 1β1- \beta를 검정력(power of test)으로 나타낸다. 다음처럼 계산한다.
아래의 식에서 μ1\mu_1은 귀무가설 모집단의 평균을 나타내고, 나머지는 Type I Error와 같다.
β(μ1)=p(Xˉ(D~)<xD~H1)=p(Xˉμ1σ/N<xμ1σ/N)\beta(\mu_1) = p(\bar{X}(\tilde{\mathcal{D}}) < x^*|\tilde{\mathcal{D}} \sim H_1) = p \left( {\bar{X} - \mu_1 \over \sigma / \sqrt{N}} < {x^* - \mu_1 \over \sigma / \sqrt{N}} \right)
이 식은 결국 대립가설이 참일 때, (즉 데이터가 H1H_1에서 왔다고 가정할 때), 주어진 임계값 xx^*보다 작은 표본 평균을 관측할 확률을 나타낸다.
Type II의 임계값은 Type I의 임계값과 동일하게 x=zασ/N+μ0x^* = z_\alpha \sigma / \sqrt{N} + \mu_0를 사용한다. —μ1\mu_1을 사용하지 않는다— 이는 임계값이 귀무가설을 기반으로 설정된 값이기 때문이다.

참고