기초통계 – 이항분포

4.1 a) 초기화 분포 b) x 0 1 2 3 4 P(X=x) $\dfrac{15}{495}$ $\dfrac{120}{495}$ $\dfrac{225}{495}$ $\dfrac{120}{495}$ $\dfrac{15}{495}$ c) $E(x) = 2, E(x^{2}) = 4.73$ $Var{x} = E(x^{2}) – (E(x))^{2} = 4.73 – 4 = 0.73$ $E(X) = np = 4 \times \dfrac{1}{2} = 2$ $Var(x) = npq{N-n \choose N-1} = 더보기…

글쓴이 dino,

범주형자료분석 – GLM

참 암게와 부수체에 관한 연구 반응변수 부수체의 개수(sat) 설명변수 색깔(color) 등뼈의 상태(spine) 등짝지 너비(width) 무게(weight) Crabs = read.table(“crabdata.txt”, header = FALSE) #Or, importing the data from the local folder colnames(Crabs) = c(“color”,”spine”,”width”,”sat”,”weight”,”y”) head(Crabs) fit = glm(sat~width, family = poisson(link = “log”), data = Crabs) #Poisson regression summary(fit) ———————————————————————————————— Call: glm(formula 더보기…

글쓴이 dino,

범주형자료분석 – Tables

1- A) Difference of proportions $\hat{\pi_{1}} = \dfrac{21}{23} = 0.913$ $\hat{\pi_{2}} = \dfrac{8}{17} = 0.470$ $SE = \sqrt{\dfrac{0.913\times (1-0.913)}{23} + \dfrac{0.47\times (1-0.47)}{17}} = 0.134$ $0.913-0.470 \pm1.96 \times 0.134 = (0.7, 0.18)$ rcode diffscoreci(21, 23, 8, 17, conf.level=0.95) #Score CI for D data: 95 percent confidence interval: 0.1648695 0.6755755 relative risk 더보기…

글쓴이 dino,

기초 통계 – 확률

1 표본공간과 사건 표본공간 실현 가능한 모든 결과들의 집합(S로 표현한다) 예제 1 주사위를 던졌을 때 윗면이 나오는 눈의 수 S = {1,2,3,4,5,6} 예제 2 동전을 한 번 던졌을 때 윗면에 보이는 면 S = {H,T} 사건(event) 표본 공간의 부분집합(A,B,C로 표현한다) 예제 1 주사위를 던졌을 때 짝수가 나오는 사건 A A 더보기…

글쓴이 dino,

python – t-test

<t-test> :  (통계적 차이 검정) – 분석 결과의 타당성을 증명하기 위해 통계적으로 차이를 검정하는 과정으로 두 집단간 차이에 대한 검정 방법이다. – 모집단의 평균 등과 같이 실제 정보를 모를 때 현재의 데이터만으로 두 집단의 차이에 대해 검정할 수 있는 방법 – 검정 대상인 두 집단의 데이터 개수가 비슷하면서 두 데이터가 더보기…

글쓴이 dino,

기초통계 – 가설검정

<가설검정> 다양한 데이터 원천을 통해 표본 데이터를 수집하는 이유 중의 하나는 표본을 통해 전체 모집단의 특성을 유추해보는 데 있다. 추론통계는 주어진 데이터의 표본 특성으로부터 수학적 확률이론을 토대로 그 데이터가 속해 있을 것으로 예상되는 전체 모집단의 특성을 추론한다. 가설검정이란 표본 데이터를 기반으로 모집단에 새로운 주장의 옮고 그름을 추론하는 과정이다. 즉 어떤 더보기…

글쓴이 dino,

기초통계 – 신뢰구간의 추정

<신뢰구간의 추정> 추정은 모집단으로 부터 추출한 표본의 통계량을 이용하여 모집단의 모수를 추론하는 과정이고, 가설검정은 모집단 모수에 대한 연구가설의 채택 여부를 모집단으로부터 추출한 표본의 통계량을 이용하여 검정하는 일련의 과정이다. 추정은 점추정과 구간추정으로 모수를 추론한다. 1. 구간추정 구간추정은 표본분포에 모집단 평균 $\mu$가 존재할 확률을 계산하는 것이다. 추정하고자 하는 모수를 구간으로 추정한다. 모수가 더보기…

글쓴이 dino,

기초통계 – 추측통계학

<추측통계학> 표본의 정보를 사용하여 모집단의 특성을 추측한다. 즉 모집단으로 부터 추출한 표본의 통계량을 이용하여 모집단의 모수를 추론하는 과정이다. ex : 보험사고 발생횟수의 예측, 선거속보, TV시청률, 신약의 유효성 확인, 사료 첨가제의 결정, 맛 관능시험 분석 점추정은 추정하고자 하는 모수를 하나의 수치로 추정으로 A대학교 학생의 평균키는 172cm 이다. 구간추정은 추정하고자 하는 모수를 더보기…

글쓴이 dino,

기초통계 – 확률분포

<확률분포> 1. 확률과 확률분포 – 주사위나 동진을 던질 때 뭐가 나올지, 그 결과는 실제로 던져 보기 전에 알수 없지만 동전을 던질 때 “앞면이 나올가능성은 50%” 이다 라고 말하는 것처럼 결과를 예측 할 수 있다. 결과는 우연히 정해지는 것이지만, 그 결과를 예측할 때는 확률이나 확률분포를 이용한다. 2. 확률변수 – 확률 실험의 더보기…

글쓴이 dino,