반응형
1. Start with larger errors : 모델을 통해 나온 모든 값을 확인하지 못하므로, 에러값이 큰 feature부터 확인하는 법
2. Segment by Classes : 평균 에러값을 기준으로 Segment를 나누어서 비교하면서 분석.
3. Unsupervised clustering : 패턴을 발견하는 어려움이 있을 경우, 비지도 학습인 클러스터릴 알고리즘을 사용하여서 분류되지 않는 값들을 확인하는 방법. 에러의 원인을 찾는 방법으로 사용해야 함.
4. Ask colleagues or domain experts : 데이터를 통해 발견할 수 없으면, 분야 전문가의 도움을 통해 에러의 원인을 찾아낼 수 있음.
반응형
'Mathematics > Statistics' 카테고리의 다른 글
독립변수와 종속변수란 무엇인가? (0) | 2021.12.30 |
---|---|
데이터 랭글링 (Data Wrangling)이란? (0) | 2021.12.30 |
Feature Engineering(특성 공학)이란? (0) | 2021.12.30 |
전처리(processing) vs 탐색적 데이터 분석(EDA) (0) | 2021.12.30 |
데이터란 무엇인가? 데이터와 정보의 개념 차이 (0) | 2021.12.30 |