이산 확률 분포
•
연속이 아닌 확률 분포
•
연속이 아니기 때문에 으로 합을 구한다.
•
확률질량함수(probability mass function, PMF)으로 표현
•
베르누이분포, 이항분포, 카테고리분포, 다항분포가 여기에 속한다.
◦
베르누이분포를 기준으로 표본이 개가 되면 이항분포가 되고, 컬럼이 개가 되면 카테고리 분포가 되고, 카테고리 분포의 표본이 개가 되면 다항분포가 된다.
베르누이 분포
•
시행 결과가 스칼라 값 또는 로 나오는 분포
기댓값
분산
확률질량함수
이항 분포
•
베르누이 분포에 대해 표본이 개 존재하는 분포.
◦
기댓값, 분산, 확률질량함수를 보면 베르누이 분포에 대해 이 적용된 것을 볼 수 있다.
기댓값
분산
확률질량함수
카테고리 분포
•
베르누이 분포에 대해 컬럼이가 개 존재하는 분포. 카테고리이므로 시행 결과는 벡터형태로 나오고, 각 벡터가 해당 컬럼에만 을 갖는 원핫-인코딩 형식을 갖는다.
기댓값
•
베르누이 분포와 유사한데, 벡터 형식이다.
분산
확률질량함수
다항 분포
•
카테고리 분포에 대해 표본이 개 존재하는 분포.
◦
기댓값, 분산, 확률질량함수를 보면 카테고리 분포에 대해 이 적용된 것을 볼 수 있다.
기댓값
분산
확률질량함수
연속 확률 분포
•
연속인 확률분포
•
연속은 으로 합을 구할 수 없기 때문에 로 합을 구한다.
•
확률밀도함수(probability density function, PDF)으로 표현
◦
확률밀도함수는 연속 확률분포에 대한 누적분포함수(cumulative distribution function, CDF)의 도함수다.
◦
다시 말해 누적분포함수를 미분한게 확률밀도함수이다. 거꾸로 확률밀도함수를 적분하면 누적분포함수가 됨.
•
연속 확률 분포에는 정규 분포 외에 정규분포에서 파생된 스튜던트 t분포, 카이제곱분포, F분포 등이 있지만 생략
정규 분포
•
평균 와 분산 만으로 정의되는 분포
•
분산의 역수를 정밀도(precision) 라고도 한다. ()
•
정규분포 중에서 평균이 이고 분산이 인 () 정규분포를 표준정규분포(standard normal distribution)이라고 한다.
확률밀도함수
•
정규분포는 일 때, 확률밀도가 최대가 되고 이나 로 다가갈수록 확률밀도가 낮아진다.
다변수 정규 분포
•
변수가 여러개인 정규 분포를 다변수 정규 분포(multivariate normal distribution, MVN)라고 한다.
•
공분산행렬의 역행렬을 정밀도 행렬(precision matrix) 이라고 한다. ()
확률밀도함수
•
차원이 인 다변수정규분포의 확률밀도함수는 평균벡터 와 공분산행렬 라는 두 모수를 가지며 다음과 같은 식으로 정의한다.
•
: 확률변수벡터
•
: 평균벡터
•
: 공분산행렬