1 데이터 수집 1.1 데이터프레임 생성 1.2 결측치 확인 1.3 자료형 확인 2 데이터 확인 2.1 컬럼별 데이터 확인 2.2 시장/마트 목록 2.3 품목 목록 2.4 자치구 목록 2.5 시장 유형 3 삼겹살 가격 분석 3.1 삼겹살 데이터 3.2 우리동네 삼겹살 가격 3.3 마트 지점별 삼겹살 가격 4 달걀 가격 분석 4.1 달걀 데이터 4.2 우리동네 달걀 가격 4.3 마트 지점별 달걀 가격
1 데이터 확인 및 전처리 1.1 2021년 공공자전거 대여이력 정보 1.1.1 데이터프레임 생성/확인 1.1.2 데이터 연결/확인 1.2 데이터 전처리 1.2.1 불필요한 컬럼 제거 1.2.2 자료형 확인/변경 1.3 결측치 확인/처리 2 일별 이용 현황 2.1 대여날짜 컬럼 추가 2.2 대여날짜 별 대여 건수 2.3 대여날짜 별 이용시간 2.4 대여날짜 별 이용 거리 2.5 데이터프레임 합치기 3 시간대 별 대여/반납 현황 3.1 대여시간, 반납시간 컬럼 추가 3.2 시간대 별 대여/반납 현황 3.3 시각화 4 대여소별 대여/반납 현황 4.1 대여소 현황 4.2 대여건수가 가장 많은 대여소 best10 4.3 반납건수가 가장 많은 대여소 best10 4.4 여의나루역 1번출구 앞 대여소 이용현황 4...
1 카운트플롯 데이터의 갯수를 카운트하여 시각화 sns.countplot(data=데이터프레임, x=컬럼) 2 러그플롯 sns.rugplot(data=데이터프레임, x=컬럼) 3 히스토그램 sns.displot(data=데이터프레임, x=컬럼) 4 상자수염그래프, 바이올린플롯, 스트립플롯, 스웜플롯 · sns.boxplot(data=데이터프레임) · sns.violinplot(data=데이터프레임) · sns.stripplot(data=데이터프레임) · sns.swarmplot(data=데이터프레임)
1 샘플 데이터 2 연도별 승객 수의 변화 2.1 matplotlib으로 시각화 2.2 Seaborn으로 시각화 sns.lineplot(data=데이터프레임, x=x축컬럼, y=y축컬럼, estimator=통계함수) estimator를 생략하면 평균으로 통계를 적용함 3 연도 - 월별 승객 수의 변화 3.1 matplotlib으로 시각화 3.2 Seaborn으로 시각화
1 샘플 데이터 2 total_bill과 tip의 관계 2.1 matplotlib으로 그리기 2.2 요일 구분하여 그리기 2.3 seaborn으로 그리기 sns.scatterplot(data=데이터프레임, x=x축컬럼, y=y축컬럼)
1 샘플 데이터 2 요일 별 팁 평균 2.1 matplotlib으로 그리기 2.2 seaborn으로 그리기 sns.barplot(data=데이터프레임명, x=x축컬럼, y=y축컬럼) · x축데이터로 그룹핑한 y축데이터의 평균값을 계산하여 그래프를 그려준다. · 신뢰구간(CI:Confidence Interval)을 함께 표시 3 요일별 팁 합계 3.1 matplotlib으로 그리기 3.2 seaborn으로 그리기 estimator = 통계함수 4 요일별 팁 합계를 흡연여부로 비교 ▶ hue : y를 그룹핑할 컬럼 ▶ hue 색상 변경 : palette = 구분:색상 딕셔너리 ▶ pyplot의 메소드로 그리드 추가