ARIMA 모형 (계절형) – 시계열분석

ARIMA 모형 (계절형) ARIMA 모형을 보기전에 먼저 계절성을 가지는 데이터로 우리나라의 실업률의 데이터로 그래프를 보면 아래와 같은 형태로 나온다. 그래프를 분석하면 트렌드를 가지고 있고 분산이 동일하지 않고, 계절적인 형태가 보인다. – 분산 안정화 $-z_{t}^{-\frac{1}{2}}$ – 추세제거 $\nabla -z_{t}^{-\frac{1}{2}}$ 분산 안정화... Read more

ARIMA 모형 (비계절성) – 시계열분석

ARIMA – 비계절성 정상시계열과 ARIMA 모형 – 정상시계열이란 데이터가 시간이 지나도 trend가 없이 자기 위치에서 움직이는 시계열 자료로 완벽한 정상 시계열은 백색잡음이다(white noise) – 백색잡음과정(white noise preocess) 백색잡음의 식을 보면 $z_{t} = \mu + \alpha_{t}, t=1,2,….T$, $\rho_{k} = Corr(z_{t},z_{t-l}) = 0$... Read more

검정

뭘 알고 싶은지? 모집단에 대한 가설… 모수의 형태로 표현해야 한다. 가설을 세우는건 법정이랑 비슷하다. 귀무가설을 기각하면 대립가설을 채택한다. 귀무가설이 맞는데 대립가설을 채택한다. (무죄인데 유죄를 준다 – 1종 오류) 대립가설이 맞는데 귀무가설을 귀학하지 못하는 오류(유죄인데 무죄를 준다(증거 불충분) – 2종 오류)... Read more

지수평활법(exponential smoothing)

지수평활법(exponential smoothing) 예를 들어 주가에 차트를 보면 이동평균선(5,20,60,120)이 있다. 120이란 말은 120일 평균을 낸것이다. 20일 이동 평균선(20MA) $\dfrac{y_{-1} + y_{-2} + …..+ y_{-20}}{20}$ 위 식을 다시 써보면 $\dfrac{1}{20}y_{-1} + \dfrac{1}{20}y_{-2} + ….+ \dfrac{1}{20}y_{-20}$으로 볼 수 있다. 즉 과거데이터랑 최신데이터랑 똑같은... Read more

표본분포 – F 분포

F분포 1. F분포의 정의 $V_{1}$과 $V_{2}$를 각각 자유도 $k_{1},k_{2}$인 카이제곱분포를 따르는 서로 독립인 확률변수들이라 할 때. $F=\dfrac{V_{1}/k_{1}}{V_{2}/k_{2}}$의 분포를 자유도 $(k_{1},k_{2})$ 인 F분포라 한다. 이를 기호로 나타내면 $F ~ F(k_{1},k_{2})$ 2. F분포의 특징 자유도에 따라 그 모양이 다르지만 대체적으로 우측으로 치우친... Read more

t 분포 – 표본분포

t 분포 $X_{1}, X_{2},…,X_{n}$이 정규 모집단 $N(\mu, \sigma^{2})$ 로부터의 확률표본이라 할 때, 표본평균 $\bar{x} = \dfrac{\sum_{i=1}^{n}X_{i}}{n}$에 대하여 $\bar{X}  ~  N(\mu, \dfrac{\sigma^{2}}{n})$ 즉 $\dfrac{\bar{X}-\mu}{\dfrac{\sigma}{\sqrt{n}}} ~ N(0,1)$ 의 분포를 따른다. 모평균 $\mu$에 관한 통계적 추론에서 $\sigma$ 이 미지인 경우 $\sigma$ 대신에 표본표준편차... Read more

카이제곱분포 – 표본분포

카이제곱분포 카이제곱분포는 표준정규분포를 따르는 확률변수 $X_{1}, X_{2},…X_{k}$라고 정의 했을 때, 해당 확률 변수의 제곱들의 분포를 카이제곱분포 라고 한다. 정규모집단에서의 표본분포( 카이제곱분포 ) 정규분포 $N(\mu, \sigma^{2})$ 으로부터의 확률표본 $X_{1},X_{2},…,X_{n}$ 이라 할 때, 표본분산 $S^{2} = \dfrac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}$ 에 대한 표본분포는 $\sigma^{2}$의 추론에... Read more

Model Building and Applying

Model Building and Applying 모형에서 설명변수 X 가 반응변수 Y 에 대하여 유의한 값을 가지는 변수를 찾아내 최적의 모형을 만드는데 목적이 있다. confirmatory – 확정적 모델을 설정하고 해당 모델의 특정변수의 윰무에 따라 모델을 비교하여 변수를 선택한다. 모형에 추가된 모수들 중... Read more

Logistic Regression

Logistic Regression 반응변수 Y 의 값이 바이너리 형태(“합격 or 불합격”, “성공 or 실패”)인 경우에 Logistic Regression 모델을 사용한다. 설명변수 X는 어떤 변수(연속형, 범주형) 가 와도 상관없다. 1. Logisitc Regression 모델 $logit[\pi(x)] = log(\dfrac{\pi(x)}{1-\pi(x)}) = \beta_{0} + \beta_{1}x$ $\pi(x) = \dfrac{exp(\beta_{0}... Read more

통계적 추정 (statistical inference)

추론 통계적 추정 은 표본으로 부터 정보를 이용하여 모집단의 모수를 추측하거나 모수에 관해 추정 한 내용의 진워를 확인하는 과정이다. 추정의 방벙은 점추정과 구간추정이 있다. 점추정 점추정(point estimation)은 하나의 값으로 모수의 참값을 추정 (모집단이랑 정확하게 같지 않다.)을 하고, 미지인 모수 $\theta$의... Read more