본문 바로가기

Programming/Python

파이썬 판다스 기본 함수

반응형

기술 통계 정보

 

정렬

데이터 프레임의 정렬은 인덱스를 정렬하는 함수와 값을 정렬하는 함수가 있다.

sort_index()는 인덱스의 데이터를 정렬

sort_values()는 값을 정렬

 

  • 정렬 기준: axis
    0: 인덱스
    1: 칼럼
  • 정렬 방향: ascending
    True: 오름차순
    False: 내림차순

 

 

값 정렬: sort_values()

 

 

결측치 확인 : isnull(), notnull()

  • 결측치는 isnull() 함수를 이용
  • 결측치가 아닌 값을 확인할 때는 notnull()을 이용

 

결측치 채우기: fillna()

결측치를 다른 값으로 치환할 때는 fillna()를 이용.

fillna()는 복제본을 반환하기 때문에 원본 데이터에 값을 바로 수정하고 싶다면 inplace 옵션을 이용

 

결측치를 채울 때 지정한 값이 아니라 결측치가 발생한 데이터의 앞이나 뒤의 값으로 채울 수 있다.

method='ffill'은 앞의 값으로, method='bfill'은 뒤의 값으로 결측치를 채운다.

 

 

결측치 삭제: dropna()

  • 결측치를 삭제할 때는 dropna()를 이용
  • dropna()는 데이터를 삭제한 복제본을 반환하기 때문에 원본 데이터를 삭제하려면 inplace=True 옵션을 이용
  • 데이터프레임은 NA값을 하나라도 포함하고 있으면 삭제
  • how=all 옵션이 있으면 모두 NA인 데이터만 삭제
  • 칼럼을 기준으로 데이터를 삭제할 때는 axis=1을 이용하여 기준이 되는 축을 칼럼으로 설정

반응형