자료의 연관 (Cov, Corr) – 기초통계학

자료의 연관 2개의 변수 사이의 자료의 연관 성을 파악한다. 1. 범주형 자료의 연관 관계 교육수준과 결혼생활의 분할표 위와 같이 교육수준과 결혼생활의 분활표가 있다. 위 표를 기반으로 교육수준에 따른 결혼생활의 조건부 분포로 정의하면 아래와 같다. 반대로 결혼생활 만족도에 따른 교육수준의 조건부... Read more

Model Building and Applying

Model Building and Applying 모형에서 설명변수 X 가 반응변수 Y 에 대하여 유의한 값을 가지는 변수를 찾아내 최적의 모형을 만드는데 목적이 있다. confirmatory – 확정적 모델을 설정하고 해당 모델의 특정변수의 윰무에 따라 모델을 비교하여 변수를 선택한다. 모형에 추가된 모수들 중... Read more

Logistic Regression

Logistic Regression 반응변수 Y 의 값이 바이너리 형태(“합격 or 불합격”, “성공 or 실패”)인 경우에 Logistic Regression 모델을 사용한다. 설명변수 X는 어떤 변수(연속형, 범주형) 가 와도 상관없다. 1. Logisitc Regression 모델 $logit[\pi(x)] = log(\dfrac{\pi(x)}{1-\pi(x)}) = \beta_{0} + \beta_{1}x$ $\pi(x) = \dfrac{exp(\beta_{0}... Read more

Generalize Linear Model – GLM

GLM(Generalized Linear Model) 설명변수가 여러개의 범주형변수 혹은 연속형 변수로 되어 있을 때 카이테스트 등의 검정 을 할 수 없다. 이러한 이유로 일반적인 모형- GLM 으로 만들어서 추정 및 검정을 해야한다. GLM 구성요소 구성요소는 3가지로 random component, systematic component, link function의 구성요소로... Read more

범주형자료분석 – Tables

1- A) Difference of proportions $\hat{\pi_{1}} = \dfrac{21}{23} = 0.913$ $\hat{\pi_{2}} = \dfrac{8}{17} = 0.470$ $SE = \sqrt{\dfrac{0.913\times (1-0.913)}{23} + \dfrac{0.47\times (1-0.47)}{17}} = 0.134$ $0.913-0.470 \pm1.96 \times 0.134 = (0.7, 0.18)$ rcode diffscoreci(21, 23, 8, 17, conf.level=0.95) #Score CI for... Read more