특성공학 | ④ 하이퍼 파라미터 튜닝(Hyper Parameter Tuning)

1. 개념

Hyper Parameter Tuning : 데이터를 학습할 때 발생하는 알고리즘의 수학적 구조를 사용자가 통제

- Random Search : 무작위로 알고리즘의 수학적 구조를 통제하여, 데이터셋에 적합한 수학적 구조를 생성

- Grid Search : 사용자가 설정한 임의의 알고리즘 구조를 통제하여, 데이터셋에 적합한 수학적 구조를 생성

 

 

2. 실습

1) 데이터셋 불러오기 및 결측치 확인

2) 설명/목표변수 선언

3) sklearn 라이브러리 설치 및 학습/검증 데이터 분할

4) Hyper Parameter 튜닝 후 학습데이터 학습

위에서 지정한 모델Hyper Parameter가 뭐가 있는지 어떻게 알까?

→ 구글 검색창에 지정한 모델을 검색하면 sklearn 공식 홈페이지에서 아래 링크와 같이 모델의 Hyper Parameter를 알려준다 !!

 

sklearn.tree.DecisionTreeClassifier

Examples using sklearn.tree.DecisionTreeClassifier: Release Highlights for scikit-learn 1.3 Classifier comparison Plot the decision surface of decision trees trained on the iris dataset Post prunin...

scikit-learn.org

작성한 Hyper Parameter를 기준으로 학습을 진행하고, 그중 가장 성능이 좋은 조건에 맞춰 모델이 만들어진다.

5) 가장 성능이 좋은 모델 찾기 / 일반화가 잘되었는지 확인