카테고리 없음
빅데이터 분석가 양성과정 19일차
statsbymin
2022. 7. 27. 07:19
강의 내용 SUMMARY
iloc : integer location
- 데이터 프레임의 행이나 컬럼의 순서를 나타내는 정수로 특정 값을 추출
- 행 번호를 기준으로 행 데이터 추출
- df.iloc[0] : 전체 데이터프레임에서 0번째 행에 있는 값들만 추출
- df.iloc[행 순서 번호, 열 순서 번호]
loc : 인덱스를 기준으로 행 데이터 추출
- df.loc[행인덱스] : 데이터프레임에서 행인덱스로 행 추출
- df.loc[0] : 전체 데이터프레임에서 인덱스 이름이 0인 행만 추출
- df.loc[행 인덱스, 열 인덱스]
count
count() : 데이터 개수 반환, NaN은 제외
values_counts() : 각각의 데이터 값의 개수 반환
정렬
sort_index() : 인덱스 값을 기준으로 정렬
sort_values() : 데이터 값을 기준으로 정렬
fillna() : 데이터 값 NaN을 원하는 값으로 변경
reset_index() : 기존의 행 인덱스를 열로 추가하고 정수 기반의 행 인덱스를 새로 지정
set_index() :기존의 행 인덱스를 삭제하고 데이터 열 중에 하나를 행 인덱스 설정
cut() : 실수 값을 크기 기준으로 카테고리 갓으로 변환, bins인수에는 실수 값의 경계선 목록을 지정
stack() : 열 인덱스를 행 인덱스로 변환
unstack() : 행 인덱스를 열 인덱스로 변환
위 함수들을 활용해 chipotle, titanic 등의 데이터셋을 가지고 전처리 실습 퀴즈들을 풀어보는 연습을 진행하였다.
마지막엔 함수에 관련된 문제들을 풀어보았는데 막막한 감이 있어 추가적인 연습이 필요하다고 판단된다.