python pandas 정렬(sort_values, nlargest, nsmallest)
python pandas 정렬
python pandas 정렬 의 기능 중 sort_values 함수를 이용하여 데이터 정렬하고 또한 nlargest(), nsmallest() 함수를 사용한다.
pandas sort_values 정렬 함수
sort_values() 함수는 dataframe의 기본 정렬 함수로 ascending 옵션을 이용하여 내림차순, 오름차순 정렬을 한다.
dataframe.sort_values(‘변수’, ascending=False)
dataframe.sort_values(‘[변수1, 변수2]’, ascending=False) 의 문법으로 사용한다.
예시) 정렬해 각 그룹에서 가장 큰 항목 선택
nlargest, nsmalles 정렬 함수
dataframe.nlargest(100, ‘변수’) – (100 숫자 parameter는 상위 100개를 의미한다.)
dataframe.nsmallest(100, ‘변수’) – (100 숫자 parameter는 하위 100개를 의미한다)
의 문법으로 사용한다.
예시) 최대 중에 최소 선택
sort_values 를 사용해 nlargest복제
예제) 최대 최소를 찾는 예제
nlargest와 nsmallest의 함수를 이용하여 최대 최소를 찾는다.
sort_values 를 이용하여 최대 최소를 찾는다.
하지만 두개의 결과는 다르다.
점수가 8.4 이상인 경우가 100개 이상 존재하기 때문에 발생한다.
nlargest 와 sort_values 는 순서가 같은 것이 여러 개 있을 때 서로 다른 방식을 사용해 이들 간의 순서를 정렬한다.
sort_values 에 kind=’mergsort’ 를 사용하면 결과는 같아진다.