본문 바로가기
Journal

빅데이터 분석가 양성과정 26일차

by statsbymin 2022. 8. 5.

미니프로젝트 

원하는 공공데이터를 찾아 numpy, pandas, matplotlib 등의 라이브러리를 활용해 데이터를 가공하고 원하는 정보를 시각화하는 프로젝트를 하루 종일 진행하였다.

데이터를 불러온 후 결측치 확인 및 처리, 시간 데이터 핸들링, 매개변수 생성 등 필요한 전처리를 진행하였는데 전처리 과정에서 에러를 해결하고 원하는 결과를 얻어내는데 오늘 수업 시간의 대부분을 사용하였다. 쉽지 않았지만 원하는 결과를 도출했을 때 막힌 속이 뚫린 느낌이 든다. 

데이터를 확인해보니 정보를 도출해볼 만한 여러 가지 아이디어가 생각났다.

데이터 컬럼이 13000개가량이다 보니 많지는 않아 한 곳의 읍면리 단위까지 파고드는 것보단 다양한 종류의 정보들을 도출해 보는데 초점을 맞췄다.

오늘까지 PPT작성을 완료해 미니프로젝트를 완료하고 주말 동안 즐겁게 가족여행을 다녀올 수 있도록 할 계획이다.