Linear Regression – 선형회귀분석

Linear Regrssion 분석을 하기 위한 기초 수식과 모형의 가설을 검정하고, 최적의 모형을 찾는 방법을 기술한다. Linear Regression 회귀 분석은 반응변수가 설명변수들에 의해 어떻게 설명되는지를 알아보기 위해 그 관계를 적절한 함수식으로 표현하여 분석하는 통계적 자료 분석 방법이다. 선형모형이란 추정 parameter 의... Read more

Two Sample T Test – statistics

two sample t test 는 두 모집단의 분산을 모를 때 두집단이 차이가 있는지 없는지 T 분포를 이용하여 검정하는 방법이다. 예 1) 지역 환경에 따라 학력에 차이가 있는지를 알아보고자 한다. 두 도시의 고등학교 1학년 학생 중에서 각각 150명과 200명을 독립적으로 랜덤추출하여... Read more

One Sample T Test – statistics

One Sample T Test 란 t 분포에 가정하여 가설을 검정하는 방법이고, 1변량에 대한 검정이다. 예제 1 : 과자 2봉지를 뜯었는데 집에 있는 저울로 과자의 내용량을 측정해보니 첫 번째 봉지는 55g 이었고, 두 번째 봉지는 44g이었으며 평균 내용량은 49.5g 이었다. 평균내용량이... Read more

LU분해 – 역행렬

1. LU분해 LU 분해는 임의의 행렬 A를 하삼각행렬 L과 상삼각행렬 U 의 곱인 A = LU로 표현하는 것을 LU분해(LU matrix decompose) 또는 LU 행렬분해라고 하고 아래와 같은 행태로 표현한다. (a) $A = \begin{bmatrix} 1 & 0 & 0 & 0... Read more

행렬특징 – 선형대수

여러가지의 행렬특징이 있다. 행렬 곱의 교환법칙 불가 $AB \neq BA$ A = $\begin{bmatrix}2 & 3 \\ 3 & 1 \\ 4 & 5 \end{bmatrix}$, B = $\begin{bmatrix} 1 & 2 & 3 \\ 2 & 3 & 4 \end{bmatrix}$ AB = $\begin{bmatrix}2 &... Read more

공분산 행렬

공분산 행렬 두 변량 값들 간의 공분산을 행렬로 표기 한것이다. 데이터구조를 설명해주며, 특히 특징 쌍(feature pairs)들의 변동이 얼마나 닮았는가(다른말로는 얼마만큼이나 함께 변하는가)를 행렬에 나타낸다 5명의 사람의 키와 몸무게 $\begin{bmatrix} 170&&70\\ 150&&45\\ 160&&55\\ 180&&60\\ 170&&80 \end{bmatrix}$ X = D – mean(D)... Read more

선형대수학 – 가우스-조단(Gauss-Jordan) 소거법

가우스-조던 소거법 행령에서 x의 해를 구하는 데 Ax = b에 대한 행 연산을 통해 해 x를 구하는 방법을 보면. Ax = b 에서 행렬 A가 단위 행렬 I라면 해는 x = b임을 알 수 있다. 이러한 행렬을 다음과 같은 절차로 기약행... Read more

자료의 연관 (Cov, Corr) – 기초통계학

자료의 연관 2개의 변수 사이의 자료의 연관 성을 파악한다. 1. 범주형 자료의 연관 관계 교육수준과 결혼생활의 분할표 위와 같이 교육수준과 결혼생활의 분활표가 있다. 위 표를 기반으로 교육수준에 따른 결혼생활의 조건부 분포로 정의하면 아래와 같다. 반대로 결혼생활 만족도에 따른 교육수준의 조건부... Read more

시계열 분해 (decompose) 방법 – 시계열 분석

시계열 분해 방법 기본적으로 시계열 분해 방법은 decompose와 같이 분해 하는 방법이다.  두 가지 type(adaptive, multi)로 decompose 하는 방법이 있다. 시계열 분해 방법은 추세와, 계설성과, 나머지 랜덤형태의 분해를 하는 것이다. 승법모형 분해와 가법 모형 분해가 있다. 승법 시계열분해 모형 $z_{t}... Read more

단위근 차분 – 시계열분석

단위근 차분 기존에는 ACF, PACF 를 통해서 ARIMA 의 차수를 정하는 것을 확인하였는데, 만약에 차분을 한다면 몇번을 해야하는지 확인하는게 단위근 을 테스트하는것이다. 추세선 + 정상성과정 + 잡음과정 으로 시계열 자료가 된다. 정상과정은 ARIMA 모형으로 구현하고, 잡음과정은 GARCH 모형에 의해 구현한다.... Read more