Skip to content

DINO ROMANTIST

#data scientist

Menu
  • AI
  • Data Science
  • IT
  • Programming

[카테고리: ] AI

Posted on2021년 12월 1일2021년 12월 7일AI

K-Means – clustering

by dinoLeave a comment on K-Means – clustering

k-means clustering 은 비계층적 군집 분석중에 하나이다. k-means clustering 기본 개념 여기서 군집분석이란 비슷한 속성을 가진 대상을 집단으로 묶는 기법이고, 비 계층적 군집 분석이란 군집이…

Read More
Posted on2021년 8월 16일2021년 9월 10일AI

의사결정나무(2) (Decision Tree)

by dinoLeave a comment on 의사결정나무(2) (Decision Tree)

의사결정나무(2) (Decision Tree) 의사결정나무의 분류 모델을 설명하고 Information Gain 에 대해서 설명한다. 1. 의사결정나무 분류 모델 concept 파란색 점이 들어 왔을 때 파란색점은 빨강색으로 예측…

Read More
Posted on2021년 6월 1일2021년 6월 4일AI

분류모형

by dinoLeave a comment on 분류모형

분류모형 classification 은 독립변수값이 주어졌을 때 그 값과 가장 연관성이 큰 종속변수값을 예측하는 것이다. 어떤 표본에 대한 데이터가 주어졌을 때 그 표본이 어떤 카테고리 혹은…

Read More
Posted on2021년 5월 31일2021년 8월 22일AI

랜덤포레스트 (Random Forests)

by dinoLeave a comment on 랜덤포레스트 (Random Forests)

랜덤포레스트 – Random Forest 의사 결정나무의 단점에 대해서 아래 주소에 정리 의사결정나무(2) (Decision Tree) 단점을 간략히 정리하면 1) 에러가 다음 단계 까지 전파가 되고, 2)학습데이터에…

Read More
Posted on2021년 5월 31일2021년 8월 20일AI

의사결정나무(1) (Decision Tree)

by dinoLeave a comment on 의사결정나무(1) (Decision Tree)

의사결정나무(1) (Decision Tree) 데이터에 내재되어 있는 패터을 변수의 조합으로 나타내는 예측/분류 모델을 나무 형태로 만드는 것이다. “스무고개” 놀이랑 비슷하다. 1. 의사결정나무 개요 데이터를 알고리즘을 이용하여…

Read More

INDEX

<통계>
– Generalized Linear Model
– Logistic Regression
– Model Building and Applying
– 자료의 연관
– 표본분포
– 표본분포 – 카이제곱분포
– 표본분포 – t 분포
– 표본분포 – F 분포
– 통계적 추정
– 지수평활법(exponential smoothing)
– ARIMA – 비계절성
– ARIMA – 계절성
– 단위근과 차분
– 시계열분해방법

<머신러닝>
–
 분류모형
– 의사결정나무(1) (Decision Tree)
– 의사결정나무(2) (Decision Tree)
– 랜덤포레스트 (Random Forests)

<선형대수학>
– 
가우스-조단 소거법
– LU 분해
– 행렬 특징
– 공분산행렬

<Programming>
–
 python – SettingWithCopyWarning
– pandas round 함수 사용시 주의할 점
– python pandas 정렬( sort_values, nlargest, nsmallest)
– python pandas 전처리 (범주형)
– EDA (EXPLORATORY DATA ANALYSIS) WITH PYTHON
– python data 시각화 – matplotlib #1
– python data 시각화 – matplotlib #2
– python data 시각화 – pandas #1
–
 python data 시각화 – pandas #2
–
 python data 시각화 – seaborn #1
– python data 시각화 – seaborn #2

<Statistics Test>
– Bartlett’s Test
– Chi Square Test
– Correlation Test
– Duncan Test
– F Test
– Friedman Test
– Kruskal-Wallis Test
– Levene’s Test
– Ljung-Box Test
– Log Likelihood Ratio Test
– Mann-Whitney Test
– Normality Test
– One Sample T Test
– Two Sample T Test
– Paired T Test
– One Way ANOVA
– Two Way ANOVA
– Tukey’s Range Test
– Wilcoxon Test
– Robust ANOVA

<Classification>
– AdaBoost Classification
– Decision Tree
– K-nearest neighbors
– Logistic Regression
– MLP Classification
– Naive Bayes
– One vs Rest LR Classifier
– Random Forest
– SVM
– XGB Classification

<Regression>
– AdaBoost Regression
– GLM
– Isotonic Regression
– Linear Regression
– Penalized Linear Regression
– PLS Regression
– Polynomlal Regression
– Stepwise Linear Regression

<Clustering>
– Agglomerative Clustring
– Gaussian Mixture
– Hlerarchical Clustering
– K-Means
– Power Iteration Clustring

<Time Series>
– ARX
– ARIMA
– Holt-Winters
– AutoCorrelation
– Cross Correlation
– Time Series Decomposition
– Time Series Distance
– Time Series Smoothen
– Unit Root Test
– SPC ruleset AD

Amphibious Theme by TemplatePocket ⋅ Powered by WordPress