반응형
기술 통계 정보
정렬
데이터 프레임의 정렬은 인덱스를 정렬하는 함수와 값을 정렬하는 함수가 있다.
sort_index()는 인덱스의 데이터를 정렬
sort_values()는 값을 정렬
- 정렬 기준: axis
0: 인덱스
1: 칼럼 - 정렬 방향: ascending
True: 오름차순
False: 내림차순
값 정렬: sort_values()
결측치 확인 : isnull(), notnull()
- 결측치는 isnull() 함수를 이용
- 결측치가 아닌 값을 확인할 때는 notnull()을 이용
결측치 채우기: fillna()
결측치를 다른 값으로 치환할 때는 fillna()를 이용.
fillna()는 복제본을 반환하기 때문에 원본 데이터에 값을 바로 수정하고 싶다면 inplace 옵션을 이용
결측치를 채울 때 지정한 값이 아니라 결측치가 발생한 데이터의 앞이나 뒤의 값으로 채울 수 있다.
method='ffill'은 앞의 값으로, method='bfill'은 뒤의 값으로 결측치를 채운다.
결측치 삭제: dropna()
- 결측치를 삭제할 때는 dropna()를 이용
- dropna()는 데이터를 삭제한 복제본을 반환하기 때문에 원본 데이터를 삭제하려면 inplace=True 옵션을 이용
- 데이터프레임은 NA값을 하나라도 포함하고 있으면 삭제
- how=all 옵션이 있으면 모두 NA인 데이터만 삭제
- 칼럼을 기준으로 데이터를 삭제할 때는 axis=1을 이용하여 기준이 되는 축을 칼럼으로 설정
반응형
'Programming > Python' 카테고리의 다른 글
파이썬 NumPy 라이브러리 장점 (0) | 2022.01.06 |
---|---|
파이썬 판다스 기능 - loop(iterrows, itertuples) (0) | 2022.01.06 |
파이썬 판다스 데이터프레임 카테고리형 데이터 (0) | 2022.01.05 |
파이썬 Pandas 라이브러리 데이터 타입 변경 (0) | 2022.01.04 |
파이썬 인자(Argument) 개념 잡기 (0) | 2022.01.04 |