#16 피봇테이블로 데이터 집계하기(pIvot_table)
▶ 행을 열로 보내기 (row -> column) 데이터프레임.pivot_table(index=, columns=, values=, aggfunc=)
- Python/파이썬_데이터분석
- · 2023. 2. 9.
1 데이터 확인 및 전처리 1.1 데이터 크기 1.2 결측치 확인 1.3 컬럼별 데이터 확인 1.4 데이터 타입 확인 및 변경 1.5 불필요한 컬럼 삭제 1.6 승차/하차 테이블 분리 1.6.1 승차 테이블 만들기 1.7 하차 테이블 만들기 2 출퇴근시간 역별 승하차 인원 분석 3 강남역의 최근 시간대 별 승하차 정보 분석 3.1 강남역의 최근 승차 정보 분석 3.2 강남역의 최근 하차 정보 분석 4 지하철 시간대 별, 역 별 이용현황 분석 4.1 시간대 별 승차 현황 4.1.1 승차 정보 집계 데이터 만들기 4.1.2 시간대 별 승차 건수 4.1.3 지하철 역 별 승차 건수 4.2 시간대 별 하차 현황 4.2.1 하차 정보 집계 테이블 만들기 4.2.2 시간대 별 하차 건수 4.2.3 지하철 역 별 하..
1 데이터 수집 1.1 데이터프레임 생성 1.2 결측치 확인 1.3 자료형 확인 2 데이터 확인 2.1 컬럼별 데이터 확인 2.2 시장/마트 목록 2.3 품목 목록 2.4 자치구 목록 2.5 시장 유형 3 삼겹살 가격 분석 3.1 삼겹살 데이터 3.2 우리동네 삼겹살 가격 3.3 마트 지점별 삼겹살 가격 4 달걀 가격 분석 4.1 달걀 데이터 4.2 우리동네 달걀 가격 4.3 마트 지점별 달걀 가격
1 데이터 확인 및 전처리 1.1 2021년 공공자전거 대여이력 정보 1.1.1 데이터프레임 생성/확인 1.1.2 데이터 연결/확인 1.2 데이터 전처리 1.2.1 불필요한 컬럼 제거 1.2.2 자료형 확인/변경 1.3 결측치 확인/처리 2 일별 이용 현황 2.1 대여날짜 컬럼 추가 2.2 대여날짜 별 대여 건수 2.3 대여날짜 별 이용시간 2.4 대여날짜 별 이용 거리 2.5 데이터프레임 합치기 3 시간대 별 대여/반납 현황 3.1 대여시간, 반납시간 컬럼 추가 3.2 시간대 별 대여/반납 현황 3.3 시각화 4 대여소별 대여/반납 현황 4.1 대여소 현황 4.2 대여건수가 가장 많은 대여소 best10 4.3 반납건수가 가장 많은 대여소 best10 4.4 여의나루역 1번출구 앞 대여소 이용현황 4...
1 데이터 불러오기 https://data.seoul.go.kr/dataList/1/literacyView.do * 파일을 utf-8로 변환하여 사용 2 데이터 확인 및 전처리 2.1 컬럼별 데이터 확인 2.2 불필요한 컬럼 삭제 2.3 자료형 변환 2.4 결측치 분석 3 구 별 확진자 동향 3.1 확진일 구 별 확진자 수 집계 3.1.1 피봇테이블 만들기 3.1.2 서울시 일 별 추가 확진자 동향 3.1.3 서울시 구별 누적확진자 비교 3.1.4 최근일 기준 지역별 추가 3.2 접촉력에 따른 확진 분석 3.2.1 접촉력에 다른 확진 건수 best10 3.2.2 최근 월 접촉력에 따른 확진 best10
▶ 그룹화하여 그룹별 데이터 집계하기 데이터프레임.groupby(그룹화 기준컬럼).통계 적용 컬럼.통계 함수() count() : 누락값을 제외한 데이터 수 size() : 누락값을 포함한 데이터 수 mean() : 평균 sum() : 합계 std() : 표준편차 min() : 최소값 max() : 최대값 sum() : 전체 합 ▶ 그룹에 사용자정의함수 적용하기 df.groupby(그룹기준컬럼).통계적용컬럼.agg(사용자정의함수,매개변수들) ▶ 그룹 오브젝트 출력하기 데이터프레임.groupby(그룹기준컬럼).groups → 그룹별 인덱스:[데이터리스트] 출력 데이터프레임.groupby(그룹기준컬럼).get_group(그룹인덱스) → 그룹별 인덱스에 해당하는 데이터프레임 출력
▶ 행을 열로 보내기 (row -> column) 데이터프레임.pivot_table(index=, columns=, values=, aggfunc=)