1 데이터 준비 및 확인 기상자료개방포털 > 데이터 > 기상관측 > 지상 > 종관기상관측(ASOS) https://data.kma.go.kr/data/grnd/selectAsosRltmList.do?pgmNo=36 [ 자료형태 ] 일자료 [ 지점 ] 전체 [ 자료 ] 기온>최저,최고,평균 [ 기간 ] 1911~2020 (10년단위로 나누어 다운로드) 1.1 데이터프레임 생성 1.2 데이터 확인 1.3 데이터타입 확인/변경 1.4 2020년 지점별 기온 데이터 추출 및 전처리 1.4.1 2020년 기온 데이터 추출하여 서브셋 만들기 1.4.2 결측치 확인 2 지점별 연평균 기온 시각화 · 연 평균기온이 높은 지역은 어디일까? · 연 평균기온이 낮은 지역은 어디일까? · 서울의 연 평균기온은 전국에서 어느정..
1 전국 기온 데이터 수집 기상자료개방포털 > 데이터 > 기상관측 > 지상 > 종관기상관측(ASOS) https://data.kma.go.kr/data/grnd/selectAsosRltmList.do?pgmNo=36 [ 자료형태 ] 일자료 [ 지점 ] 전체 [ 자료 ] 기온 > 최저, 최고, 평균 [ 기간 ] 1911~2020 (10년단위로 나누어 다운로드) 2 전국 기온 데이터 확인 2.1 데이터프레임 생성 2.2 데이터프레임 연결하기 pd.concat(데이터프레임리스트, axis=0) : 행 방향으로 연결(default) pd.concat(데이터프레임리스트, axis=1) : 열 방향으로 연결 ignore_index=True : 인덱스 제지정 2.3 데이터타입 확인/변경 2.3.1 데이터타입 확인 2..
1 카운트플롯 데이터의 갯수를 카운트하여 시각화 sns.countplot(data=데이터프레임, x=컬럼) 2 러그플롯 sns.rugplot(data=데이터프레임, x=컬럼) 3 히스토그램 sns.displot(data=데이터프레임, x=컬럼) 4 상자수염그래프, 바이올린플롯, 스트립플롯, 스웜플롯 · sns.boxplot(data=데이터프레임) · sns.violinplot(data=데이터프레임) · sns.stripplot(data=데이터프레임) · sns.swarmplot(data=데이터프레임)
1 샘플 데이터 2 연도별 승객 수의 변화 2.1 matplotlib으로 시각화 2.2 Seaborn으로 시각화 sns.lineplot(data=데이터프레임, x=x축컬럼, y=y축컬럼, estimator=통계함수) estimator를 생략하면 평균으로 통계를 적용함 3 연도 - 월별 승객 수의 변화 3.1 matplotlib으로 시각화 3.2 Seaborn으로 시각화
1 샘플 데이터 2 total_bill과 tip의 관계 2.1 matplotlib으로 그리기 2.2 요일 구분하여 그리기 2.3 seaborn으로 그리기 sns.scatterplot(data=데이터프레임, x=x축컬럼, y=y축컬럼)
1 샘플 데이터 2 요일 별 팁 평균 2.1 matplotlib으로 그리기 2.2 seaborn으로 그리기 sns.barplot(data=데이터프레임명, x=x축컬럼, y=y축컬럼) · x축데이터로 그룹핑한 y축데이터의 평균값을 계산하여 그래프를 그려준다. · 신뢰구간(CI:Confidence Interval)을 함께 표시 3 요일별 팁 합계 3.1 matplotlib으로 그리기 3.2 seaborn으로 그리기 estimator = 통계함수 4 요일별 팁 합계를 흡연여부로 비교 ▶ hue : y를 그룹핑할 컬럼 ▶ hue 색상 변경 : palette = 구분:색상 딕셔너리 ▶ pyplot의 메소드로 그리드 추가