자료의 연관 (Cov, Corr) – 기초통계학

자료의 연관 2개의 변수 사이의 자료의 연관 성을 파악한다. 1. 범주형 자료의 연관 관계 교육수준과 결혼생활의 분할표 위와 같이 교육수준과 결혼생활의 분활표가 있다. 위 표를 기반으로 교육수준에 따른 결혼생활의 조건부 분포로 정의하면 아래와 같다. 반대로 결혼생활 만족도에 따른 교육수준의 조건부... Read more

시계열 분해 (decompose) 방법 – 시계열 분석

시계열 분해 방법 기본적으로 시계열 분해 방법은 decompose와 같이 분해 하는 방법이다.  두 가지 type(adaptive, multi)로 decompose 하는 방법이 있다. 시계열 분해 방법은 추세와, 계설성과, 나머지 랜덤형태의 분해를 하는 것이다. 승법모형 분해와 가법 모형 분해가 있다. 승법 시계열분해 모형 $z_{t}... Read more

단위근 차분 – 시계열분석

단위근 차분 기존에는 ACF, PACF 를 통해서 ARIMA 의 차수를 정하는 것을 확인하였는데, 만약에 차분을 한다면 몇번을 해야하는지 확인하는게 단위근 을 테스트하는것이다. 추세선 + 정상성과정 + 잡음과정 으로 시계열 자료가 된다. 정상과정은 ARIMA 모형으로 구현하고, 잡음과정은 GARCH 모형에 의해 구현한다.... Read more

ARIMA 모형 (계절형) – 시계열분석

ARIMA 모형 (계절형) ARIMA 모형을 보기전에 먼저 계절성을 가지는 데이터로 우리나라의 실업률의 데이터로 그래프를 보면 아래와 같은 형태로 나온다. 그래프를 분석하면 트렌드를 가지고 있고 분산이 동일하지 않고, 계절적인 형태가 보인다. – 분산 안정화 $-z_{t}^{-\frac{1}{2}}$ – 추세제거 $\nabla -z_{t}^{-\frac{1}{2}}$ 분산 안정화... Read more

ARIMA 모형 (비계절성) – 시계열분석

ARIMA – 비계절성 정상시계열과 ARIMA 모형 – 정상시계열이란 데이터가 시간이 지나도 trend가 없이 자기 위치에서 움직이는 시계열 자료로 완벽한 정상 시계열은 백색잡음이다(white noise) – 백색잡음과정(white noise preocess) 백색잡음의 식을 보면 $z_{t} = \mu + \alpha_{t}, t=1,2,….T$, $\rho_{k} = Corr(z_{t},z_{t-l}) = 0$... Read more

검정

뭘 알고 싶은지? 모집단에 대한 가설… 모수의 형태로 표현해야 한다. 가설을 세우는건 법정이랑 비슷하다. 귀무가설을 기각하면 대립가설을 채택한다. 귀무가설이 맞는데 대립가설을 채택한다. (무죄인데 유죄를 준다 – 1종 오류) 대립가설이 맞는데 귀무가설을 귀학하지 못하는 오류(유죄인데 무죄를 준다(증거 불충분) – 2종 오류)... Read more

지수평활법(exponential smoothing)

지수평활법(exponential smoothing) 예를 들어 주가에 차트를 보면 이동평균선(5,20,60,120)이 있다. 120이란 말은 120일 평균을 낸것이다. 20일 이동 평균선(20MA) $\dfrac{y_{-1} + y_{-2} + …..+ y_{-20}}{20}$ 위 식을 다시 써보면 $\dfrac{1}{20}y_{-1} + \dfrac{1}{20}y_{-2} + ….+ \dfrac{1}{20}y_{-20}$으로 볼 수 있다. 즉 과거데이터랑 최신데이터랑 똑같은... Read more

표본분포 – F 분포

F분포 1. F분포의 정의 $V_{1}$과 $V_{2}$를 각각 자유도 $k_{1},k_{2}$인 카이제곱분포를 따르는 서로 독립인 확률변수들이라 할 때. $F=\dfrac{V_{1}/k_{1}}{V_{2}/k_{2}}$의 분포를 자유도 $(k_{1},k_{2})$ 인 F분포라 한다. 이를 기호로 나타내면 $F ~ F(k_{1},k_{2})$ 2. F분포의 특징 자유도에 따라 그 모양이 다르지만 대체적으로 우측으로 치우친... Read more

t 분포 – 표본분포

t 분포 $X_{1}, X_{2},…,X_{n}$이 정규 모집단 $N(\mu, \sigma^{2})$ 로부터의 확률표본이라 할 때, 표본평균 $\bar{x} = \dfrac{\sum_{i=1}^{n}X_{i}}{n}$에 대하여 $\bar{X}  ~  N(\mu, \dfrac{\sigma^{2}}{n})$ 즉 $\dfrac{\bar{X}-\mu}{\dfrac{\sigma}{\sqrt{n}}} ~ N(0,1)$ 의 분포를 따른다. 모평균 $\mu$에 관한 통계적 추론에서 $\sigma$ 이 미지인 경우 $\sigma$ 대신에 표본표준편차... Read more

카이제곱분포 – 표본분포

카이제곱분포 카이제곱분포는 표준정규분포를 따르는 확률변수 $X_{1}, X_{2},…X_{k}$라고 정의 했을 때, 해당 확률 변수의 제곱들의 분포를 카이제곱분포 라고 한다. 정규모집단에서의 표본분포( 카이제곱분포 ) 정규분포 $N(\mu, \sigma^{2})$ 으로부터의 확률표본 $X_{1},X_{2},…,X_{n}$ 이라 할 때, 표본분산 $S^{2} = \dfrac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}$ 에 대한 표본분포는 $\sigma^{2}$의 추론에... Read more