1. 개념
Cross Validation : 데이터를 번갈아가며, 학습 및 검증 작업 진행
위 그림과 같이 학습/검증 데이터로만 분할하였을 경우, 데이터의 개수가 적거나 밸런스가 깨져있으면 문제가 생길 수 있다.
데이터를 여러개로 나누어 돌아가며 검증데이터를 지정하는 방식이다.
2. 실습
1) 설명/목표변수 선언
2) sklearn의 cross_val_score 사용
5번의 교차검증 후, 각 경우마다 모델의 성능을 알아볼 수 있다.
'Machine Learning' 카테고리의 다른 글
특성공학 | ⑤ 샘플링(Sampling) (0) | 2024.02.29 |
---|---|
특성공학 | ④ 하이퍼 파라미터 튜닝(Hyper Parameter Tuning) (0) | 2024.02.29 |
특성공학 | ② 차원축소(Scaling) & 데이터 변환(Encoding) (0) | 2024.01.26 |
특성공학 | ① 결측치 처리(Imputation) (0) | 2024.01.26 |
머신러닝의 기본 개념 (0) | 2024.01.26 |