1. 표본 분포
모분산이 알려진 경우 (비현실적, 이상적인 경우)
X1, X2 가 취할 수 있는 값은 각각 0, 1, 2, 3 이다. 표본평균 X의 확률분포를 구하기 위하여 X1, X2 의 결합분포를 생각하면, 위 표와 같이 나타낼 수 있다.
한편, X1, X2 가 취할 수 있는 값은 각각 0, 1, 2, 3 이므로, X의 관찰 가능한 값은 0, 0.5, 1, 1.5, 2, 2.5, 3 이므로, X1과 X2사이에는 아래와 같은 관계가 있다.
X=0 : (X1, X2 ) = (0, 0)
X=0.5 : (X1, X2 ) = (0, 1), (1, 0)
X=1.0 : (X1, X2 ) = (0, 2), (1, 1), (2, 0)
X=1.5 : (X1, X2 ) = (0, 3), (1, 2), (2, 1), (3, 0)
X=2.0 : (X1, X2 ) = (1, 3), (3, 1), (2, 2)
X=2.5 : (X1, X2 ) = (2, 3), (3, 2)
X=3.0 : (X1, X2 ) = (3, 3)
따라서, X의 확률분포는 아래 표와 같다.
중심극한 정리와 표본평균의 표본분포 비교
(참고) 표본 비율을 특정할 수 없는 경우, 1/2 로 지정한다.
2. 카이제곱분포
모평균을 추정하기 위해 표본평균을 사용
모분산을 추정하기 위해 표본분산을 사용
모평균 추론을 위해서 표본평균의 분포를 알아야
모분산 추론을 위해서 표본분산의 분포를 알아야
카이제곱분포
감마분포에서 α=n/2, β=2 인 특수한 경우를 자유도 n인 카이분포라고 한다.
두 범주형 변수간의 연관성을 검정하는데 주로 사용
카이제곱분포 만들기
1. 표준정규분포에서
2. 변수 한 개(자유도 1) 를 랜덤하게 추출
3. 그 변수를 제곱해서 히스토그램으로 표현
이 과정을 반복하면, 아래 양의 히스토그램.
한번에 추출하는 변수가 2개 이상, 즉 자유도 2개 이상이면, 변수들을 각각 제곱해서 더함. 따라서, 더해주는 변수가 많아질 수록 정규분포에 접근(중심극한 정리)
카이제곱 분포 응용
샘플수가 무수히 많고 합을 이용해 오차를 정의하는 경우, 오차의 분포를 정규분포를 따름(중심극한 정리)
3. T 분포
모분산이 알려지지 않은 경우 (현실적인 경우)
정리