python pandas 정렬(sort_values, nlargest, nsmallest)

python pandas 정렬

python pandas 정렬 의 기능 중 sort_values 함수를 이용하여 데이터 정렬하고 또한 nlargest(), nsmallest() 함수를 사용한다.

pandas sort_values 정렬 함수

sort_values() 함수는 dataframe의 기본 정렬 함수로 ascending 옵션을 이용하여 내림차순, 오름차순 정렬을 한다.

dataframe.sort_values(‘변수’, ascending=False)

dataframe.sort_values(‘[변수1, 변수2]’, ascending=False) 의 문법으로 사용한다.

예시) 정렬해 각 그룹에서 가장 큰 항목 선택

nlargest, nsmalles 정렬 함수

dataframe.nlargest(100, ‘변수’) – (100 숫자 parameter는 상위 100개를 의미한다.)

dataframe.nsmallest(100, ‘변수’) – (100 숫자 parameter는 하위 100개를 의미한다)

의 문법으로 사용한다.

예시) 최대 중에 최소 선택

sort_values 를 사용해 nlargest복제

예제) 최대 최소를 찾는 예제

nlargest와 nsmallest의 함수를 이용하여 최대 최소를 찾는다.

sort_values 를 이용하여 최대 최소를 찾는다.

하지만 두개의 결과는 다르다.

점수가 8.4 이상인 경우가 100개 이상 존재하기 때문에 발생한다.

nlargest 와 sort_values 는 순서가 같은 것이 여러 개 있을 때 서로 다른 방식을 사용해 이들 간의 순서를 정렬한다.

sort_values 에 kind=’mergsort’ 를 사용하면 결과는 같아진다.

답글 남기기