PYTHON DATA 시각화 – SEABORN #2

Read more

PYTHON DATA 시각화 – SEABORN #1

Read more

PYTHON DATA 시각화 – PANDAS #2

Read more

PYTHON DATA 시각화 – PANDAS #1

Read more

PYTHON DATA 시각화 – MATPLOTLIB #2

Read more

PYTHON DATA 시각화 – MATPLOTLIB #1

Read more

EDA (Exploratory Data Analysis) with Python

EDA (Exploratory Data Analysis) 는 수집한 데이터를 다양한 각도에서 관찰하고 이해하는 과정이다. Python 으로 하는 방법을 정리하고자 한다. EDA 기본 – 데이터 기본정보 확인 데이터를 읽고 데이터를 확인한다.확인 방법은 .sample, head 의 명령어로 확인 할수 있다. 해당 함수를 이용하여 기본적인... Read more

python pandas 전처리 (범주형)

pandas 데이터 전처리 (범주형) 범주형 자료의 데이터 전처리를 하기 위해 pandas 전처리 하는 방법에 대해 정리 1. 전처리 하기 위한 데이터 검색 주어진 자료에서 범주형 데이터를 확인해야 한다.  data type을 확인하여 범주형인지 아닌지를 판단 할 수 있는데 보통 범주형 자료의... Read more

python pandas 정렬(sort_values, nlargest, nsmallest)

python pandas 정렬 python pandas 정렬 의 기능 중 sort_values 함수를 이용하여 데이터 정렬하고 또한 nlargest(), nsmallest() 함수를 사용한다. pandas sort_values 정렬 함수 sort_values() 함수는 dataframe의 기본 정렬 함수로 ascending 옵션을 이용하여 내림차순, 오름차순 정렬을 한다. dataframe.sort_values(‘변수’, ascending=False) dataframe.sort_values(‘[변수1, 변수2]’,... Read more

python pandas round 함수 사용 시 주의

python pandas round 함수를 사용시 주의할 점 pandas round 함수는 뱅커 반올림(bankers rounding) 연산을 한다. 숫자가 양쪽의 한 가운데 있을 경우에 가까운 짝수 쪽으로 만드는 것이다. 즉 0.5를 반올림 하면 0이 되고, 1.5를 반올림 하면 2가 된다. 이런 공식이 나온... Read more