반응형
결측치란 말 그대로 데이터에 값이 없는 것을 뜻한다. 줄여서 NA라고도 하고, Null 이라는 표현도 쓴다.
이러한 결측치는 데이터 분석하는데 있어 매우 방해가 된다.
- 결측치를 다 제거하면 막대한 데이터 손실을 부를 수 있다.
- 결측치를 잘못 대체하면 데이터에서 편향이 생길 수 있다.
- 결측치 처리에 분석가의 견해가 가장 많이 반영되고 분석결과가 매우 틀어질 수 있다.
그래서 결측치를 자세하게 처리하기 위해서 많은 시간을 투자해야 한다. 자신의 주관적인 생각이 아닌, 데이터에 기반한 결측치 처리가 진행되어야 분석을 정확하게 할 수 있다.
반응형
'Mathematics > Statistics' 카테고리의 다른 글
데이터의 4가지 수준 (0) | 2022.01.07 |
---|---|
팀 버너스 리의 월드 와이드 웹 (0) | 2021.12.31 |
회귀분석(regression analysis)이란? (0) | 2021.12.30 |
독립변수와 종속변수란 무엇인가? (0) | 2021.12.30 |
데이터 랭글링 (Data Wrangling)이란? (0) | 2021.12.30 |