5. 확률분포의 분산과 표준편차

확률분포의 위치에 대한 정보를 주는 특성치인 평균만으로는 분포의 특성을 알기 어렵다. 따라서 분포가 평균을 기준으로 어떻게 산포되어 있는가를 나타내는 특성치를 생각하게 된다. 이러한 특성치들 중에서 대표적인 것이 분산 및 표준편차이다.

확률변수 X의 확률밀도함수가 f이고 평균이 $\mu$ 일 때, X의 확률분포의 분산과 표준편차는 각각
$Var(X) = E[(X-\mu)^{2}] = \begin{cases}
\sum_{x}(x-\mu)^{2}f(x)\quad\quad\quad\quad\ \  (X가 이산형)\\
\int{-\infty}^{+\infty}(x-\mu)^{2}f(x)dx\quad (X가 연속형)\\
\end{cases}$
$Sd(X) = \sqrt Var(X)$

ex_5_1)

두 확률분포의 분산을 구하여라

(a) $f_{1}(x) = I_{[0 1]}(x)$

(b) $f_{2}(x) = (2-4|x-1/2|)I_{[0 1]}(x)$

<풀이>

두 확률 분포의 평균이 $\mu_{1}, \mu_{2}$ 라고 하면
$\mu_{1} = \int_{-\infty}^{+\infty}xf_{1}(x)dx = \int_{0}^{1}xdx=1/2$
$\mu_{2} = \int_{0}^{1}x(2-4|x-1/2|)dx=\int_{0}^{1/2}x(4x)dx + \int_{1/2}^{1}x(4-4x)dx = 1/2$

두 확률분포의 분산을 각각
$\sigma_{1}^{2} = \int_{-\infty}^{+\infty}(x-\mu)^{2}f_{1}(x)dx = \int_{0}^{1}(x-1/2)^{2}dx = 1/12$
$\sigma_{2}^{2} = \int_{0}^{1}(x-1/2)^{2}(2-4|x-1/2\)dx = \int_{-1/2}^{1/2}t^{2}(2-4|t|)dt = 1/24$

정리_1_1) 기댓값의 성질

(a) (선형성) $E(aX+b) = aE(X) + b$ (a,b는 확률변수가 아닌 상수)
(b) (선형성) $E[c_{1}g_{1}(X) + c_{2}g_{2}(X)] = c_{1}E[g_{1}(X)] + c_{2}E[g_{2}(X)] (c_{1},c_{2}$는 상수)
(c) (단조성) $g_{1}(X) \le g_2(X)$ 이면 $E[g_{1}(X)] \le E[g_{2}(X)]$

평균이나 분산과 같은 분포의 특성치를 계산할 대, 기댓값의 성질을 이용하면 편리하다.

정리_1_2) 분산의 성질과 계산공식

(a) $Var(aX+b) = a^{2}Var(X) \ (a,b 는 상수)$
(b) $Var(X) = E(X^{2}) – {E(x)}^{2}$

<증명>

확률변수  X의 평균을 E(X) = $\mu$ 라 하면 기댓값의 성질로 부터
$E(aX+b) = aE(X) + b = a\mu + b$

(a) Y = aX + b라고 하면
$Var(Y) = E[(Y-E(Y))^{2}] = E[(aX+b-(a\mu + b))^{2}]$
= $E[a^{2}(X-\mu)^{2}] = a^{2}E[(X-\mu)^{2}]$
= $a^{2}Var(X)$

(b) 분산의 정의와 기댓값의 선형성으로부터
$Var(X) = E[(X-\mu)^{2}] = E[(X^{2}-2\mu X+\mu^{2})]$
= $E(X^{2}) – 2\mu E(X) + \mu^{2} = E(X^{2}) – 2\mu^{2} + \mu^{2}$
= $E(X^{2}) – {E(X)}^{2}$

ex_5_2)

(a) 균등 분포인경우
$\mu = E(X) = 1/2, E(X^{2}) = \int_{0}^{1}x^{2}dx = 1/3$
$\therefore Var(X) = E(X^{2})-\mu^{2}=1/3-(1/2)^{2} = 1/12$

(b) 삼각분포인 경우
$\mu = E(X) = 1/2, E(X^{2}) = \int_{0}^{1/2}x^{2}(4x)dx + \int_{1/2}^{1}x^{2}(4-4x)dx = 7/24$
$\therefore Var(X) = E(X^{2})-\mu^{2}=7/24 – (1/2)^{2} = 1/24$

확률변수의 표준화

평균이 $\mu$ 이고 표준편차가 $\sigma$ 이고 $\sigma > 0$ 일때
$Z=\frac{X-E(X)}{\sqrt Var(X)} = \frac{X – \mu}{\sigma}$ 라고 하면,
기댓값과 분산의 성질로 부터
$E(Z_ = (E(X) – \mu)/\sigma =0,\ Var(Z) = Var(X)/\sigma^{2} = 1$

평균이나 분산이 실수로 정의될 수 없는 확률분포가 있음에 유의하여야 한다. 예를 들어, 다음의 확률밀도함수를 갖는 확률변수에 대햐여는 평균이나 분산을 정의할 수 없다.
$f(k) = P(X=k) = \frac{1}{k(k+1)},\ k=1,2, \cdot\cdot\cdot$


1개의 댓글

iirizpqoyb · 2021년 3월 26일 2:45 오후

Muchas gracias. ?Como puedo iniciar sesion?

답글 남기기

이메일 주소는 공개되지 않습니다.