#16 피봇테이블로 데이터 집계하기(pIvot_table)
▶ 행을 열로 보내기 (row -> column) 데이터프레임.pivot_table(index=, columns=, values=, aggfunc=)
- Python/파이썬_데이터분석
- · 2023. 2. 9.
더보기 ▶ 라이브러리 임포트 import matplotlib.pyplot as plt 더보기 ▶ 시간의 시각화 더보기 ▶ 수량 비교 시각화 더보기 ▶ 비율의 시각화 더보기 ▶ 분포의 시각화 더보기 ▶ 관계의 시각화
더보기 ▶ 기본 그래프 그리기 plt.plot(data) 더보기 ▶ y축 데이터로 그리기 - 1차원 리스트, 튜플, 시리즈 데이터를 전달하여 그린다. - x축은 데이터의 인덱스로 자동 지정된다. 더보기 ▶ x축, y축 데이터로 그리기 - x축과 y축 데이터의 길이가 같아야 한다.
▶ 그룹화하여 그룹별 데이터 집계하기 데이터프레임.groupby(그룹화 기준컬럼).통계 적용 컬럼.통계 함수() count() : 누락값을 제외한 데이터 수 size() : 누락값을 포함한 데이터 수 mean() : 평균 sum() : 합계 std() : 표준편차 min() : 최소값 max() : 최대값 sum() : 전체 합 ▶ 그룹에 사용자정의함수 적용하기 df.groupby(그룹기준컬럼).통계적용컬럼.agg(사용자정의함수,매개변수들) ▶ 그룹 오브젝트 출력하기 데이터프레임.groupby(그룹기준컬럼).groups → 그룹별 인덱스:[데이터리스트] 출력 데이터프레임.groupby(그룹기준컬럼).get_group(그룹인덱스) → 그룹별 인덱스에 해당하는 데이터프레임 출력
▶ 행을 열로 보내기 (row -> column) 데이터프레임.pivot_table(index=, columns=, values=, aggfunc=)
▶ 열을 행으로 보내기(column → row) 데이터프레임.melt() ▶ 고정할 칼럼 지정하여 melt id_vars = [열 리스트] : 위치를 그대로 유지할 열 리스트 ▶ 행으로 위치를 변경할 열 지정 value_var = [열 리스트] ▶ 컬럼명 변경하기 var_name = 컬럼 명 : value_vars로 위치를 변경한 열 이름 value_name = var_name으로 위치를 변경한 열의 데이터를 저장한 열 이름 ▶ 행을 열로 보내기(row → column) 데이터프레임.pivot(index=, columns=, values=) ▶ 행, 열 바꾸기 데이터프레임.trnspose()
▶ 컬럼명 기준으로 연결 pd.concat(데이터프레임 리스트) ▶ 인덱스 기준으로 연결 pd.concat(데이터프레임 리스트, axis=1) ▶ 공통된 컬럼을 기준으로 열 방향으로 연결 pd.merge(left, right, on=기준컬럼, how=연결방법) ¤ concat: 한 번에 여러개의 데이터프레임 연결 ¤ merge: 한 번에 두개의 데이터프레임 연결 (how='inner'(default))