#2 데이터 확인하기

▶ 데이터 미리보기

 

  ▷ 가장 앞의 n행 보기

    데이터프레임.head(n)
    시리즈.head(n)
    ※ n을 생략하면 5개의 행을 출력한다

  ▷ 가장 뒤의 n행 보기
    데이터프레임.tail(n)

    ※ n을 생략하면 5개의 행을 출력한다

  ▷ 랜덤 n개 데이터 보기
    데이터프레임.sample(n)
    ※ n을 생략하면 1개의 샘플을 출력한다

 

  ▷ 랜덤 샘플 비율로 보기
    데이터프레임.sample(frac=0.2)

  ▷ 높은 순 보기
    데이터프레임.nlargest(갯수,컬럼명)
    ※ 컬럼의 데이터가 숫자형일 때 사용할 수 있다.

  ▷ 낮은순 보기

    데이터프레임.nsmallest(갯수,컬럼명)
    ※ 컬럼의 데이터가 숫자형일 때 사용할 수 있다.

 

 

▶ 데이터 요약 보기

 

  ▷ (행,열)의 크기 보기

    데이터프레임.shape

  ▷ 데이터의 갯수 보기

    len(데이터프레임)

  ▷ 컬럼명 보기

    데이터프레임.columns

  ▷ 인덱스 보기
    데이터프레임.index

  ▷ 데이터의 자료형 보기

    데이터프레임.dtypes

  ▷  데이터프레임 정보 보기

    데이터프레임.info()
    데이터프레임의 총 샘플 갯수, 컬럼 수, 컬럼 별 정보 등을 확인한다.

  ▷ 컬럼의 유니크한 데이터 뽑기
    데이터프레임['컬럼'].unique()

  ▷ 컬럼의 유니크한 값의 갯수 보기
    데이터프레임['컬럼'].value_counts()

  ▷ 요약 통계 보기

    데이터프레임.describe()