카테고리 없음

빅데이터 분석가 양성과정 19일차

statsbymin 2022. 7. 27. 07:19

 

강의 내용 SUMMARY

 

iloc : integer location

  • 데이터 프레임의 행이나 컬럼의 순서를 나타내는 정수로 특정 값을 추출
  • 행 번호를 기준으로 행 데이터 추출
  • df.iloc[0] : 전체 데이터프레임에서 0번째 행에 있는 값들만 추출
  • df.iloc[행 순서 번호, 열 순서 번호]

loc : 인덱스를 기준으로 행 데이터 추출

  • df.loc[행인덱스] : 데이터프레임에서 행인덱스로 행 추출
  • df.loc[0] : 전체 데이터프레임에서 인덱스 이름이 0인 행만 추출
  • df.loc[행 인덱스, 열 인덱스]

count

count() : 데이터 개수 반환, NaN은 제외
values_counts() : 각각의 데이터 값의 개수 반환

 

정렬

sort_index() : 인덱스 값을 기준으로 정렬
sort_values() : 데이터 값을 기준으로 정렬

 

 

fillna() : 데이터 값 NaN을 원하는 값으로 변경 
reset_index() : 기존의 행 인덱스를 열로 추가하고 정수 기반의 행 인덱스를 새로 지정
set_index() :기존의 행 인덱스를 삭제하고 데이터 열 중에 하나를 행 인덱스 설정
cut() : 실수 값을 크기 기준으로 카테고리 갓으로 변환, bins인수에는 실수 값의 경계선 목록을 지정 

 

stack() : 열 인덱스를 행 인덱스로 변환
unstack() : 행 인덱스를 열 인덱스로 변환

 

위 함수들을 활용해 chipotle, titanic 등의 데이터셋을 가지고 전처리 실습 퀴즈들을 풀어보는 연습을 진행하였다. 

마지막엔 함수에 관련된 문제들을 풀어보았는데 막막한 감이 있어 추가적인 연습이 필요하다고 판단된다.