▶ 열 추가/수정하기 데이터프레임[컬럼명] = 추가/수정할데이터 데이터프레임[컬럼명] = 컬럼 간 연산 ※ 컬럼이 존재하면 수정, 존재하지 않으면 추가된다. ▶ 열 삭제하기 데이터프레임.drop(columns = 삭제할 컬럼 리스트, inplace=True) ▶ 전체 컬럼명 변경하기 데이터프레임.columns = 컬럼 리스트 ※ 컬럼 리스트의 항목 수는 컬럼 개수와 동일해야 한다. ▶ 특정 컬럼명 변경하기 데이터프레임.rename(columns = 현재 컬럼명:바꿀 컬럼명의 쌍의로 된 딕셔너리)
▶ 멧플롯립 라이브러리 임포트 matplotlib 패키지의 pyplot 모듈을 사용! ▶ x축, y축 데이터 준비 ▶ 그래프 그리기 라이브러리의 메소드에 데이터를 전달하여 그리기 ※ 여러 그래프를 겹쳐서 그릴 수 있음 ! ▶ 그래프 기능 추가하기
행 번호, 열 번호란? 행의 위치, 열의 위치를 나타내는 것으로, 각각 인덱스, 컬럼명과는 구분된다. ▶ 행 번호로 행 추출하기 데이터프레임명.iloc[행 번호] : 시리즈 형태로 추출 데이터프레임명.iloc[행 번호 리스트] : 데이터프레임 형태로 추출 데이터프레임명.iloc[행 번호 슬라이스] : 데이터프레임 형태로 추출 ※ 음수를 사용하면 행번호를 뒤에서부터 센다. ▶ 행 번호, 열 번호로 행, 열 추출하기 데이터프레임명.iloc[행 번호, 열 번호] : 한 개의 데이터 데이터프레임명.iloc[행 번호, 열 번호 리스트] : 한 개의 행, 여러 열 데이터프레임명.iloc[행 번호 리스트, 열 번호] : 여러 행, 한 개의 열 데이터프레임명.iloc[행 번호 리스트, 열 번호 리스트] : 여러 행, ..
인덱스란? 인덱스는 '행 이름'으로, '행 번호'와는 다르다! (*행 번호는 행 위치로 이해하면 됨.) ☆ 인덱스를 별도로 지정하지 않으면 0부터 1씩 증가하는 정수로 자동 지정 ▶ 인덱스로 행 데이터 추출하기 데이터프레임명.loc[인덱스] : 시리즈 형태로 추출한다. 하나의 인덱스만 사용 가능하다. 데이터프레임명.loc[인덱스리스트] : 데이터프레임 형태로 추출한다. 한개 이상의 인덱스를 사용할 수 있다. ☆ 하나의 행을 추출하더라도, '[]'으로 묶어주면 데이터프레임 형식으로 추출할 수 있음 ! ☆ 인덱스에 없는 값을 사용하면 KeyError 발생 ! ▶ 인덱스로 행, 열 데이터 추출하기 데이터프레임명.loc[인덱스, 컬럼명] : 한 개의 데이터 추출 데이터프레임명.loc[인덱스, 컬럼리스트] : 한..
▶ 시리즈 만들기 pd.Series(리스트) 시리즈 : 엑셀시트의 열 1개를 의미한다.(1차원 리스트형태) ▶ 시리즈의 index와 value 가져오기 시리즈의 index 가져오기 : 시리즈.index 시리즈의 value 가져오기 : 시리즈.values ※ 시리즈의 인덱스는 리스트의 인덱스와 다른 개념이다. ※ 시리즈의 인덱스는 데이터의 이름이고, 행 번호는 따로 있다. ▶ 시리즈의 index 지정하기 시리즈.index = 인덱스리스트 ※ 시리즈의 인덱스는 숫자, 문자열 모두 가능하다. ▶ 시리즈의 통계값 사용하기 평균 : 시리즈.mean() 최소값 : 시리즈.min() 최대값 : 시리즈.max() 중간값 : 시리즈.median() 표준편차 : 시리즈.std() ※ 시리즈의 통계값은 시리즈의 value가..
▶ 데이터 미리보기 ▷ 가장 앞의 n행 보기 데이터프레임.head(n) 시리즈.head(n) ※ n을 생략하면 5개의 행을 출력한다 ▷ 가장 뒤의 n행 보기 데이터프레임.tail(n) ※ n을 생략하면 5개의 행을 출력한다 ▷ 랜덤 n개 데이터 보기 데이터프레임.sample(n) ※ n을 생략하면 1개의 샘플을 출력한다 ▷ 랜덤 샘플 비율로 보기 데이터프레임.sample(frac=0.2) ▷ 높은 순 보기 데이터프레임.nlargest(갯수,컬럼명) ※ 컬럼의 데이터가 숫자형일 때 사용할 수 있다. ▷ 낮은순 보기 데이터프레임.nsmallest(갯수,컬럼명) ※ 컬럼의 데이터가 숫자형일 때 사용할 수 있다. ▶ 데이터 요약 보기 ▷ (행,열)의 크기 보기 데이터프레임.shape ▷ 데이터의 갯수 보기 le..