1. 개념
Hyper Parameter Tuning : 데이터를 학습할 때 발생하는 알고리즘의 수학적 구조를 사용자가 통제
- Random Search : 무작위로 알고리즘의 수학적 구조를 통제하여, 데이터셋에 적합한 수학적 구조를 생성
- Grid Search : 사용자가 설정한 임의의 알고리즘 구조를 통제하여, 데이터셋에 적합한 수학적 구조를 생성
2. 실습
1) 데이터셋 불러오기 및 결측치 확인
2) 설명/목표변수 선언
3) sklearn 라이브러리 설치 및 학습/검증 데이터 분할
4) Hyper Parameter 튜닝 후 학습데이터 학습
위에서 지정한 모델의 Hyper Parameter가 뭐가 있는지 어떻게 알까?
→ 구글 검색창에 지정한 모델을 검색하면 sklearn 공식 홈페이지에서 아래 링크와 같이 모델의 Hyper Parameter를 알려준다 !!
sklearn.tree.DecisionTreeClassifier
Examples using sklearn.tree.DecisionTreeClassifier: Release Highlights for scikit-learn 1.3 Classifier comparison Plot the decision surface of decision trees trained on the iris dataset Post prunin...
scikit-learn.org
작성한 Hyper Parameter를 기준으로 학습을 진행하고, 그중 가장 성능이 좋은 조건에 맞춰 모델이 만들어진다.
5) 가장 성능이 좋은 모델 찾기 / 일반화가 잘되었는지 확인
'Machine Learning' 카테고리의 다른 글
분류모델 | ① 의사결정나무 모델(Decision Tree Model) (0) | 2024.03.01 |
---|---|
특성공학 | ⑤ 샘플링(Sampling) (0) | 2024.02.29 |
특성공학 | ③ 교차 검증(Cross Validation) (0) | 2024.02.29 |
특성공학 | ② 차원축소(Scaling) & 데이터 변환(Encoding) (0) | 2024.01.26 |
특성공학 | ① 결측치 처리(Imputation) (0) | 2024.01.26 |