#15 데이터의 통계값을 표현하는 박스플롯

 라이브러리 임포트 

 

 샘플 데이터 

 박스플롯 

plt.boxplot(data)

데이터로부터 얻어진 아래의 다섯 가지 요약 수치를 사용해서 그려진다.
· 최소값
· 제 1사분위 수 (Q1) : 전체 데이터 중 하위 25%에 해당하는 값
· 제 2사분위 수 또는 중위수 (Q2)
· 제 3사분위 수 (Q3) : 전체 데이터 중 상위 25%에 해당하는 값
· 최대값

 

다른 값들과 동떨어진 값을 이상치로 표현한다.
· 어떤 값이 (1/4 지점의 값 - 1.5 * 사분위수 범위) 보다 작거나,
· 어떤 값이 (3/4 지점의 값 + 1.5 * 사분위수 범위) 보다 크면 그 값을 이상치로 정한다.

 

사분위수 범위 = 3/4 지점의 값 - 1/4 지점의 값

 평균 표시하기 

showmeans=True

meanline=True

 

 수평 박스플롯 

vert=False

 

 여러개의 데이터 비교하기