카이제곱분포 – 표본분포

카이제곱분포

카이제곱분포는 표준정규분포를 따르는 확률변수 $X_{1}, X_{2},…X_{k}$라고 정의 했을 때, 해당 확률 변수의 제곱들의 분포를 카이제곱분포 라고 한다.

정규모집단에서의 표본분포( 카이제곱분포 )

정규분포 $N(\mu, \sigma^{2})$ 으로부터의 확률표본 $X_{1},X_{2},…,X_{n}$ 이라 할 때,

표본분산 $S^{2} = \dfrac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}$ 에 대한 표본분포는 $\sigma^{2}$의 추론에 유용하게 쓰인다.

이 때 표본분산 $S^{2}$에 관계 되는 분포로서 카이제곱분포가 있다.

카이제곱분포 정의

확률변수 $Z_{1}, Z_{2},…,Z_{k}$가 각각 표준정규분포 N(0,1)을 따르고 독립일 때 $Z_{1}^{2}, Z_{2}^{2},…,Z_{k}^{2}$의 분포를 자유도(degrees of freedom) k인 카이제곱분포라 하고 $Z_{1}^{2}, Z_{2}^{2},…,Z_{k}^{2} ~ \chi^{2}(k)$ 라고 표한한다.

예제)

확률변수 V가 자유도 4인 카이제곱분포를 따른다고 할 때 $p(V \ge v) = 0.05$가 성립하는 v의 값은?

위의 분포표를 확인하면 v = 9.49의 값을 가질 수 있다.

$V$ ~ $chi^{2}(k)$일 때 $p(V \ge v) = \alpha$ 가 성립하는 v의 값을 자유도 k인 카이제곱분포의 100(1-$alpha$)% 백분위수라 하며 $\chi^{2}(k,\alpha)$로 나타낸다. 예를 들어 $\chi^{2}(4,0.95)=0.711, chi^{2}(4,0.05) = 9.49$ 로 나타낸다.

카이제곱분포 가법성

$V_{1}$ ~ $\chi^{2}(k_{1})$, $V_{2}$ ~ $\chi^{2}(k_{2})$ 이고

$V_{1}$ 과 $V_{2}$가 서로 독립이면 $V_{1}+V_{2}$ ~ $\chi^{2}(k_{1}+k_{2})$

$V_{1}$ ~ $\chi^{2}(k_{1})$, $V_{2}$ ~ $\chi^{2}(k_{2})$

$k_{1} > k_{2}$, $ V_{1} = V_{2} + V_{3}$ 그리고 $V_{2}$과 $V_{3}$가 서로 독립이면 $V_{3}$ ~ $\chi^{2}(k_{1} – k_{2})$

정규모집단에서의 표본분산의 분포

$X_{1}, X_{2},…,X_{n}$을 정규분포 $N(\mu, \sigma^{2})$로 부터의 확률표본이라 할 때,

표본분산 $S^{2} = \dfrac{\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}}{n-1}$에 대하여

$\dfrac{(n-1)S^{2}}{\sigma^{2}}$ ~ $\chi^{2}(n-1)$ 이 된다.

분산이 동일한 두 정규모집단에서의 표본분산의 분포

$X_{1}, X_{2},…,X_{n_{1}}$과 $Y_{1}, Y_{2},…,Y_{n_{2}}$ 가 각각 정규분포 $N(\mu_{1}, \sigma^{2}), N(\mu_{2}, \sigma^{2})$ 를 따르며 서로 독립인 확률표본이라 할 때

$S_{1}^{2} = \dfrac{\sum_{i=1}^{n_{1}}(X_{i}-\bar{X})^{2}}{n_{1}-1}$,

$S_{2}^{2} = \dfrac{\sum_{i=1}^{n_{2}}(Y_{i}-\bar{Y})^{2}}{n_{2}-1}$ 에 대하여

$S_{p}^{2} = \dfrac{(n_{1}-1)S_{1}^{2} + (n_{2}-1)S_{2}^{2}}{n_{1}+n_{2}-2}$ 라 정의 하면

$\dfrac{(n_{1}+n_{2}-2)S_{p}^{2}}{\sigma^{2}}$ ~ $\chi^{2}(n_{1}+n_{2}-2)$

예제)

정규모집단 $N(1,2^{2})$에서의 크기 10인 확률표본을 추출 하였을 때 표본분산 $S^{2}$에 대하여 $P(S^{2} \le y) = 0.05$기 성립하는 y값을 구하여라

$\dfrac{(n-1)S^{2}}{\sigma^{2}}$ ~ $\chi^{2}(n-1)$이므로 $\dfrac{(n-1)S^{2}}{\sigma^{2}}$ ~ $\chi^{2}(9)$이다.

$\dfrac{9}{4}S^{2}$~$\chi^{2}{9}$로

$P[\dfrac{9}{4}S^{2} \ge \chi^{2}(9;0.95)] = 0.95$ 이다.

$P[\dfrac{9}{4}S^{2} < \chi^{2}(9;0.95)] = 0.05$

$P[S^{2} < \dfrac{4}{9}\chi^{2}(9;0.95)] = 0.05$ 가 된다.

$y = \dfrac{4}{9} \times \chi^{2}(9;0.95)$ = $\dfrac{4}{9} \times 3.325 = 1.1478$ 이 된다.

“카이제곱분포 – 표본분포”의 4개의 댓글

답글 남기기