Linear Regression – 선형회귀분석

Linear Regrssion 분석을 하기 위한 기초 수식과 모형의 가설을 검정하고, 최적의 모형을 찾는 방법을 기술한다. Linear Regression 회귀 분석은 반응변수가 설명변수들에 의해 어떻게 설명되는지를 알아보기 위해 그 관계를 적절한 함수식으로 표현하여 분석하는 통계적 자료 분석 방법이다. 선형모형이란 추정 parameter 의... Read more

PYTHON DATA 시각화 – SEABORN #2

Read more

PYTHON DATA 시각화 – SEABORN #1

Read more

PYTHON DATA 시각화 – PANDAS #2

Read more

PYTHON DATA 시각화 – PANDAS #1

Read more

PYTHON DATA 시각화 – MATPLOTLIB #2

Read more

PYTHON DATA 시각화 – MATPLOTLIB #1

Read more

EDA (Exploratory Data Analysis) with Python

EDA (Exploratory Data Analysis) 는 수집한 데이터를 다양한 각도에서 관찰하고 이해하는 과정이다. Python 으로 하는 방법을 정리하고자 한다. EDA 기본 – 데이터 기본정보 확인 데이터를 읽고 데이터를 확인한다.확인 방법은 .sample, head 의 명령어로 확인 할수 있다. 해당 함수를 이용하여 기본적인... Read more

K-Means – clustering

k-means clustering 은 비계층적 군집 분석중에 하나이다. k-means clustering 기본 개념 여기서 군집분석이란 비슷한 속성을 가진 대상을 집단으로 묶는 기법이고, 비 계층적 군집 분석이란 군집이 아래의 그림과 같이 Hierarchical 구조가 아닌것을 말한다. 즉 아래와 같은 군집의 형태로 만들어 주어 분석하는... Read more

Two Sample T Test – statistics

two sample t test 는 두 모집단의 분산을 모를 때 두집단이 차이가 있는지 없는지 T 분포를 이용하여 검정하는 방법이다. 예 1) 지역 환경에 따라 학력에 차이가 있는지를 알아보고자 한다. 두 도시의 고등학교 1학년 학생 중에서 각각 150명과 200명을 독립적으로 랜덤추출하여... Read more