특성공학 | ③ 교차 검증(Cross Validation)

1. 개념

Cross Validation : 데이터를 번갈아가며, 학습 및 검증 작업 진행

 

위 그림과 같이 학습/검증 데이터로만 분할하였을 경우, 데이터의 개수가 적거나 밸런스가 깨져있으면 문제가 생길 수 있다.

데이터를 여러개로 나누어 돌아가며 검증데이터를 지정하는 방식이다.

 

2. 실습

1) 설명/목표변수 선언

2) sklearn의 cross_val_score 사용

 

5번의 교차검증 후, 각 경우마다 모델의 성능을 알아볼 수 있다.