t 분포 – 표본분포

t 분포

$X_{1}, X_{2},…,X_{n}$이 정규 모집단 $N(\mu, \sigma^{2})$ 로부터의 확률표본이라 할 때, 표본평균 $\bar{x} = \dfrac{\sum_{i=1}^{n}X_{i}}{n}$에 대하여 $\bar{X}  ~  N(\mu, \dfrac{\sigma^{2}}{n})$ 즉 $\dfrac{\bar{X}-\mu}{\dfrac{\sigma}{\sqrt{n}}} ~ N(0,1)$ 의 분포를 따른다.

모평균 $\mu$에 관한 통계적 추론에서 $\sigma$ 이 미지인 경우 $\sigma$ 대신에 표본표준편차 $S=\sqrt{\dfrac{\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}}{n-1}}$을 대입하여 스튜던트화 된 확률변수가 $\dfrac{\bar{X}-\mu}{\dfrac{S}{\sqrt{n}}}$ 를 사용하는 경우가 많은데 이 확률변수는 t 분포를 따른다.

t 분포의 정의

표준정규분포 $N(0,1)$을 따르는 확률변수를 Z라 하고 이와는 독립이면 자유도 k인 카이제곱분포를 따르는 확률변수 V라 하면 $T = \dfrac{Z}{\sqrt{V/k}}$의 분포를 자유도 k인 t의 분포라 하고 이를 기호로 나타내면 T~t(k) 이다.

t 분포의 특징

t 분ㅍ도 표준정규분포와 마찬가지로 0을 중심으로 좌우대칭형이지만 표준정규분포에 비하여 두터운 꼬리를 지니고 있다.

예제)

확률변수 T가 자유도 4인 t분포를 따를 때 P(T>t) = 0.05가 성립하는 t값은?

위의 t 분포표를 참조하면 t = 2.132 가 된다. T ~ t(k) 일 때 $p(T \ge t) = \alpha$ 가 성립하는 t의 값을 자유도 k인 t분포의 $100(1-\alpha)%$ 백분위수라 하면 $t(k,\alpha)$로 나타낸다. t(4,0.05)=2.132 가 된다.

3, Basu의 정리

$X_{1}, X_{2}, …. , X_{n} ~ N(\mu, \sigma^{2})$일 때 $\bar{X}$와 $S^{2}$은 서로 독립이다.

스튜던트화 된 확률변수의 분포

정규분포 $N(\mu, \sigma^{2})$으로부터의 확률표본 X_{1},X_{2},….,X_{n}에 대하여 $\dfrac{\bar{X} – \mu}{\dfrac{S}{\sqrt{n}}} ~ t(n-1)$ 이된다.

<증명>

$\dfrac{\bar{X} – \mu}{\dfrac{S}{\sqrt{n}}} = \dfrac{(\bar{X}-\mu)/(\sigma/\sqrt{n})}{\sqrt{\dfrac{(n-1)S^{2}}{\sigma^{2}}/(n-1)}}$ 인데 Basu정리에 의하여 $\bar{X}$와 $S^{2}$은 서로 독립이므로 t 분포의 정의에 의하여 $\dfrac{\bar{X}-\mu}{S/\sqrt{n}}~t(n-1)$

분산이 동일한 두 정규모집단에서의 t 분포

$X_{1}, X_{2},…,X_{n_{1}}$과 $Y_{1}, Y_{2},…,Y_{n_{2}}$ 가 각각 정규분포 $N(\mu_{1}, \sigma^{2}), N(\mu_{2}, \sigma^{2})$ 를 따르며 서로 독립인 확률표본이라 할 때 $S_{1}^{2} = \dfrac{\sum_{i=1}^{n_{1}}(X_{i}-\bar{X})^{2}}{n_{1}-1}$, $S_{2}^{2} = \dfrac{\sum_{i=1}^{n_{2}}(Y_{i}-\bar{Y})^{2}}{n_{2}-1}$ 에 대하여 $S_{p}^{2} = \dfrac{(n_{1}-1)S_{1}^{2} + (n_{2}-1)S_{2}^{2}}{n_{1}+n_{2}-2}$ 라 정의 하면 $\dfrac{(\bar{X}-\bar{Y}) – (\mu_{1}-\mu_{2})}{S_{p}\sqrt{\dfrac{1}{n_{1}}+\dfrac{1}{n_{2}}}} ~ t(n_{1}+n_{2}-2)$

 

답글 남기기