Imputation
1. 결측치를 처리하는 기존 방법
① dropna() : 결측치가 있는 행을 삭제
② fillna(0) : 결측치를 특정값(0)으로 대치
2. sklearn의 SimpleImputer 사용
: strategy를 변경하여 다양한 통계값으로 결측치를 대치할 수 있음 (default : mean)
'Machine Learning' 카테고리의 다른 글
특성공학 | ⑤ 샘플링(Sampling) (0) | 2024.02.29 |
---|---|
특성공학 | ④ 하이퍼 파라미터 튜닝(Hyper Parameter Tuning) (0) | 2024.02.29 |
특성공학 | ③ 교차 검증(Cross Validation) (0) | 2024.02.29 |
특성공학 | ② 차원축소(Scaling) & 데이터 변환(Encoding) (0) | 2024.01.26 |
머신러닝의 기본 개념 (0) | 2024.01.26 |