Search
Duplicate

확률, 통계/ Poisson, Negative Binomial 분포

Poisson distribution

X{0,1,2,...}X \in \{0,1,2,...\}을 가정하자. 만일 pmf가 다음과 같다면 확률 변수가 파라미터 λ>0\lambda >0인 Poisson 분포(XPoi(λ)X \sim \text{Poi}(\lambda))를 갖는다고 말한다.
Poi(xλ)=eλλxx!\text{Poi}(x|\lambda) = e^{-\lambda}{\lambda^x \over x!}
여기서 λ\lambdaxx의 평균(과 분산)이다.

Negative binomial distribution

NN개 공이 있는 ‘항아리(urn)’가 있다고 가정하자. RR은 빨간공이고 BB는 파란공이다.
n1n \ge 1 공을 얻을 때까지 교체를 통해 샘플링을 수행한다고 가정하자. XX를 파란공의 수를 나타내면 XBin(n,p)X \sim \text{Bin}(n,p)로 볼 수 있다. 여기서 p=B/Np = B/N은 파란공의 비율이다. 따라서 XX는 binomial(이항) 분포를 따른다.
이제 빨간공을 뽑는 것을 ‘실패’라고 하고, 파란공을 뽑는 것을 ‘성공’이라고 가정한다. rr개 실패를 관찰할 때까지 공을 뽑는다.
XX를 성공의 수라 하면, 이것은 XNegBinom(r,p)X \sim \text{NegBinom}(r,p)로 볼 수 있다. 이것은 negative binomial distribution이라 하고 다음처럼 정의된다. x{0,1,2,...}x \in \{0,1,2,...\}
NegBinom(xr,p)(x+r1x)(1p)rpx\text{NegBinom}(x|r,p) \triangleq \binom{x+r-1}{x}(1-p)^r p^x
rr이 실수이면 (x1)!=Γ(x)(x-1)! = \Gamma(x)라는 사실을 이용하여 (x+r1x)\binom{x+r-1}{x}Γ(x+r)x!Γ(r){\Gamma(x+r) \over x!\Gamma(r)}로 교체할 수 있다.
이 분포는 다음의 moment(적률)을 갖는다.
E[x]=pr1p,V[x]=pr(1p)2\mathbb{E}[x] = {pr \over 1-p}, \mathbb{V}[x] = {pr \over (1-p)^2}
이 2가지 파라미터 족은 평균과 분산을 분리하여 표현할 수 있기 때문에 푸아송 분포보다 더 유연한 모델링을 갖는다.
예를 들어 발생 건수가 양의 상관관계를 가지며, 발생 건수가 독립적인 경우보다 더 큰 분산을 유발하는 ‘전염성’ 이벤트를 모델링하는데 유용하다.
사실 Poi(λ)=limrNegBinom(r,λ1+λ)\text{Poi}(\lambda) = \lim_{r \to \infty} \text{NegBinom}(r,{\lambda \over 1 + \lambda})으로 나타낼 수 있기 때문에 푸아송 분포는 negative binomial의 특별한 경우이다.
또 다른 특별한 경우는 r=1r=1인 경우인데 이것은 geometric(기하) 분포라고 부른다.

참조