기초통계 – 기본개념
1. 통계학이란
자료 수집, 정리, 제시 분석, 해석의 과학
2. 통계학의 분류
수집 : 표집법(sampling)
정리, 제시 : 기술통계(descriptive statistics)
분석, 해석 : 추론통계(inferential statistics)
3. 통계학
4. 통계적 가설 검증 방법
- 문제 정의
- 자료수집
- 탐색적 자료분석
- 가설검증
5. 자료수집 절차
- 분석문제 결정
- 스포츠용품 전문 기업에서 신규사업으로 골프의상을 제작하기로 하려한다. 고객의 신체 사이즈를 정확히 모르는 상태에서 어떤 사이즈의 신제품을 만들어야 하는가?
- 대상 선정
- 신체사이즈에 대한 조사가 가능한 임직원을 대상으로 여러 개의 표본을 구성
- 임의로 해당 표본을 선정하고 해당 표본의 구성원을 무작위로 선정
- 관심속성 결정(성별, 키, 허리둘레….)
- 척도 설정(남 or 여, cm, inch…) ->
- 측정
- 데이터 셋 생성
6. 관련자료 수집
- 분석은 자료로 부터 시작(자료 -> 분석 -> 정보)
- 자료는 관심대상을 선정한 후 대상의 특정한 속성을 척도를 이용해서 측정한 다음 이른 변수 값으로 축척함으로 만들어 짐(data set)
7. 자료 관련 용어
- 변수 : 특정한 속성을 척도를 통애 측정될 수 있는 값들 -> 변할 수 있는 값
- 관측값 : 변수(들)이 측정을 통해 실현된 값
8. 자료의 종류
- 질적(범주형) 자료
- 명목 척도 : 관찰대상의 속성에 따라 관찰대상을 상호 배타적인 범주를 부여 ex)성별, 거주지
- 서열(순위) 척도 : 관찰대상의 속성의 크기를 측정하여 대상의 순위를 부여 ex)등수
- 양적(수치형) 자료
- 구간(등간) 척도 : 관찰대상의 속성의 크기와 상대적 차이를 부여
- 비율척도 : 관찰대상의 속성의 크기, 상대적 차이, 절대적 차이(0의 존재)를 부여
- 시계열 자료
- 다양한 시점에서 동일한 시간 간격으로 실험을 기록한 자료
- 관측값 사이에 시간 주기성이 존재
- 시간의 경과에 따른 트랜드나 형태에 관심이 있는 경우 사용
- 주가, 현금흐름
- 횡단면 자료
- 동일한 시점에서 서로다른 개별적인 단위에 대해 실험(사건)을 기록한 자
- 관측값 사이에 변동에 관심이 있는 경우 사용
- 변수와 변수 사이의 연관성에 관심이 있는 경우 사용
- 20개 기업 매출액 및 미수금, 성인 100명의 월말 잔액 등
- 전수조사
- 문제(가설) 대상의 모든 사건을 조사하는 경우 -> 모집단
- 표본조사
- 문제(가설) 대상의 일부 사건을 조사하는 경우 -> 표본
- 취득하는 대부분의 자료가 표본조사에 해당