BAEKUP, DATA !
close
프로필 배경
프로필 로고

BAEKUP, DATA !

  • 분류 전체보기 (130)
    • STARTERS 4기 (60)
      • [STARTERS] 학습 일지 (11)
      • [STARTERS] TIL (49)
    • Python (49)
      • 파이썬_데이터분석 (21)
      • 파이썬_데이터시각화 (28)
    • SQL (0)
    • Algorithm (5)
    • Machine Learning (8)
    • 금융권 소식 (6)
  • 홈
  • Algorithm
  • 태그
특성공학 | ③ 교차 검증(Cross Validation)

특성공학 | ③ 교차 검증(Cross Validation)

1. 개념 Cross Validation : 데이터를 번갈아가며, 학습 및 검증 작업 진행 위 그림과 같이 학습/검증 데이터로만 분할하였을 경우, 데이터의 개수가 적거나 밸런스가 깨져있으면 문제가 생길 수 있다. 데이터를 여러개로 나누어 돌아가며 검증데이터를 지정하는 방식이다. 2. 실습 1) 설명/목표변수 선언 2) sklearn의 cross_val_score 사용 5번의 교차검증 후, 각 경우마다 모델의 성능을 알아볼 수 있다.

  • format_list_bulleted Machine Learning
  • · 2024. 2. 29.
  • textsms
백준 | 2750 : 수 정렬하기 (Python/파이썬)

백준 | 2750 : 수 정렬하기 (Python/파이썬)

문제 N개의 수가 주어졌을 때, 이를 오름차순으로 정렬하는 프로그램을 작성하시오. 입력 첫째 줄에 수의 개수 N(1 ≤ N ≤ 1,000)이 주어진다. 둘째 줄부터 N개의 줄에는 수가 주어진다. 이 수는 절댓값이 1,000보다 작거나 같은 정수이다. 수는 중복되지 않는다. 출력 첫째 줄부터 N개의 줄에 오름차순으로 정렬한 결과를 한 줄에 하나씩 출력한다. 풀이 버블 정렬 : 두 인접한 데이터의 크기를 비교해 정렬하는 방법 간단하게 구현할 수 있지만, 시간 복잡도는 O(n²) 1. 변수 n(수의 개수), a(n개의 수 - 리스트) 선언 리스트 a를 a=[]로 선언한 후, 반복문을 통해 값을 변경하도록 코드를 작성해 실패했다. 애초에 존재하지 않는 인덱스의 값을 변경하려고 했기 때문이다. a=[0]*n 으..

  • format_list_bulleted Algorithm
  • · 2024. 2. 1.
  • textsms
특성공학 | ② 차원축소(Scaling) & 데이터 변환(Encoding)

특성공학 | ② 차원축소(Scaling) & 데이터 변환(Encoding)

Scaling & Encoding 1. Scaling : 숫자데이터의 서로 다른 차원(Scale)을 맞춰주는 작업 1) Standard Scaling : 평균이 0, 표준편차 1 2) Min Max Scaling : 최소값 0, 최대값 1 3) Robust Scaling : 중앙값 0, 사분범위 1 📌 기존 통계값 확인 📌 Standard Scaling → 평균이 0, 표준편차가 1에 수렴 📌 Robust Scaling → 중앙값이 0 2. Encoding : 문자데이터를 숫자데이터로 변환 1) Label Encoding : 문자데이터를 단순히 숫자데이터로 변환 → 숫자 간 서열을 인식해버릴 수 있음 2) One Hot Encoding : 문자데이터를 컬럼으로 변경 후 0과 1로 데이터 유무를 표시 pd..

  • format_list_bulleted Machine Learning
  • · 2024. 1. 26.
  • textsms
특성공학 | ① 결측치 처리(Imputation)

특성공학 | ① 결측치 처리(Imputation)

Imputation 1. 결측치를 처리하는 기존 방법 ① dropna() : 결측치가 있는 행을 삭제 ② fillna(0) : 결측치를 특정값(0)으로 대치 2. sklearn의 SimpleImputer 사용 : strategy를 변경하여 다양한 통계값으로 결측치를 대치할 수 있음 (default : mean)

  • format_list_bulleted Machine Learning
  • · 2024. 1. 26.
  • textsms
머신러닝의 기본 개념

머신러닝의 기본 개념

1. 머신러닝의 기본 원리 머신러닝(기계학습) : 컴퓨터가 데이터로부터 새로운 규칙/수식을 도출해내는 작업 1. 학습 능력 : 기존의 데이터를 잘 학습하여, 적절한 규칙을 도출해내는 능력 2. 일반화 능력 : 새로운 데이터가 들어왔을 떄, 정확한 값을 예측하여 대응하는 능력 머신러닝의 핵심 3요소 - 데이터 : 데이터를 통해 적절한 수식/규칙을 찾을 수 있도록 이를 깔끔하게 다듬어야 함(특성공학) - 알고리즘 : 데이터의 종류에 따라 적절한 알고리즘을 선택 - 성능 : 컴퓨터의 하드웨어 능력 2. 머신러닝의 종류 1) 지도학습 : 목표변수(Y)와 설명변수(X)간의 관계를 수식화하여, 새로운 설명변수(X)에 대해 목표변수(Y)를 예측하거나 분류하는 학습 기법 - 예측 (Regression), Y 연속형 :..

  • format_list_bulleted Machine Learning
  • · 2024. 1. 26.
  • textsms

[파이썬/Python] 백준 반복문(2739번/15552번/10951번)

2739번 N을 입력받은 뒤, 구구단 N단을 출력하는 프로그램을 작성하시오. 출력 형식에 맞춰서 출력하면 된다. n = int(input()) for i in range(1, 10) : print('%d * %d = %d'% (n, i, n*i)) 파이썬을 배워보자 9일차 - 반복문(while, for) 점프 투 파이썬 : https://wikidocs.net/book/1파이썬 기본을 갈고 닦자 : https://wikidocs.net/16031보통 대부분의 언어가 반복문으로 for, while이 있다. (go는 for문만 있다) 파이썬 역시도 for velog.io 15552번 첫 줄에 테스트케이스의 개수 T가 주어진다. T는 최대 1,000,000이다. 다음 T줄에는 각각 두 정수 A와 B가 주어진다..

  • format_list_bulleted Algorithm
  • · 2023. 9. 6.
  • textsms
  • navigate_before
  • 1
  • 2
  • 3
  • 4
  • 5
  • ···
  • 22
  • navigate_next
전체 카테고리
  • 분류 전체보기 (130)
    • STARTERS 4기 (60)
      • [STARTERS] 학습 일지 (11)
      • [STARTERS] TIL (49)
    • Python (49)
      • 파이썬_데이터분석 (21)
      • 파이썬_데이터시각화 (28)
    • SQL (0)
    • Algorithm (5)
    • Machine Learning (8)
    • 금융권 소식 (6)
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바