One Sample T Test – statistics

One Sample T Test 란 t 분포에 가정하여 가설을 검정하는 방법이고, 1변량에 대한 검정이다. 예제 1 : 과자 2봉지를 뜯었는데 집에 있는 저울로 과자의 내용량을 측정해보니 첫 번째 봉지는 55g 이었고, 두 번째 봉지는 44g이었으며 평균 내용량은 49.5g 이었다. 평균내용량이... Read more

LU분해 – 역행렬

1. LU분해 LU 분해는 임의의 행렬 A를 하삼각행렬 L과 상삼각행렬 U 의 곱인 A = LU로 표현하는 것을 LU분해(LU matrix decompose) 또는 LU 행렬분해라고 하고 아래와 같은 행태로 표현한다. (a) $A = \begin{bmatrix} 1 & 0 & 0 & 0... Read more

python pandas 전처리 (범주형)

pandas 데이터 전처리 (범주형) 범주형 자료의 데이터 전처리를 하기 위해 pandas 전처리 하는 방법에 대해 정리 1. 전처리 하기 위한 데이터 검색 주어진 자료에서 범주형 데이터를 확인해야 한다.  data type을 확인하여 범주형인지 아닌지를 판단 할 수 있는데 보통 범주형 자료의... Read more

python pandas 정렬(sort_values, nlargest, nsmallest)

python pandas 정렬 python pandas 정렬 의 기능 중 sort_values 함수를 이용하여 데이터 정렬하고 또한 nlargest(), nsmallest() 함수를 사용한다. pandas sort_values 정렬 함수 sort_values() 함수는 dataframe의 기본 정렬 함수로 ascending 옵션을 이용하여 내림차순, 오름차순 정렬을 한다. dataframe.sort_values(‘변수’, ascending=False) dataframe.sort_values(‘[변수1, 변수2]’,... Read more

python pandas round 함수 사용 시 주의

python pandas round 함수를 사용시 주의할 점 pandas round 함수는 뱅커 반올림(bankers rounding) 연산을 한다. 숫자가 양쪽의 한 가운데 있을 경우에 가까운 짝수 쪽으로 만드는 것이다. 즉 0.5를 반올림 하면 0이 되고, 1.5를 반올림 하면 2가 된다. 이런 공식이 나온... Read more

의사결정나무(2) (Decision Tree)

의사결정나무(2) (Decision Tree) 의사결정나무의 분류 모델을 설명하고 Information Gain 에 대해서 설명한다. 1. 의사결정나무 분류 모델 concept 파란색 점이 들어 왔을 때 파란색점은 빨강색으로 예측 초록색 점이 들어오면 주위의 검정색 점이 5개로 검정색으로 예측 2. 의사결정나무 분류나무 모델 각 관측치... Read more

행렬특징 – 선형대수

여러가지의 행렬특징이 있다. 행렬 곱의 교환법칙 불가 $AB \neq BA$ A = $\begin{bmatrix}2 & 3 \\ 3 & 1 \\ 4 & 5 \end{bmatrix}$, B = $\begin{bmatrix} 1 & 2 & 3 \\ 2 & 3 & 4 \end{bmatrix}$ AB = $\begin{bmatrix}2 &... Read more

공분산 행렬

공분산 행렬 두 변량 값들 간의 공분산을 행렬로 표기 한것이다. 데이터구조를 설명해주며, 특히 특징 쌍(feature pairs)들의 변동이 얼마나 닮았는가(다른말로는 얼마만큼이나 함께 변하는가)를 행렬에 나타낸다 5명의 사람의 키와 몸무게 $\begin{bmatrix} 170&&70\\ 150&&45\\ 160&&55\\ 180&&60\\ 170&&80 \end{bmatrix}$ X = D – mean(D)... Read more

선형대수학 – 가우스-조단(Gauss-Jordan) 소거법

가우스-조던 소거법 행령에서 x의 해를 구하는 데 Ax = b에 대한 행 연산을 통해 해 x를 구하는 방법을 보면. Ax = b 에서 행렬 A가 단위 행렬 I라면 해는 x = b임을 알 수 있다. 이러한 행렬을 다음과 같은 절차로 기약행... Read more

python – pandas SettingWithCopyWarning

DataFrame 의 자료 구조에서  새로운 column을 만들고 column에 값을 넣을 때 아래와 같은 SettingWithCopyWarning 메시지가 발생한다. <ipython-input-64-04010302304>:1: SettingWithCopyWarning: A values is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_indexer] = value instead... Read more