어제부터 새로운 미니 프로젝트를 시작했다.
주제는 이번 주 배운 내용을 활용하여 원하는 데이터를 가지고 plotly를 활용해 EDA를 진행해 보는 것인데 kaggle, UCI Machine Learning Repository 등 여러 사이트의 많은 데이터 중 어떤 데이터를 선택할지 고민이 많았다.
dacon 사이트의 데이콘 Basic 여행 상품 신청 여부 예측 경진대회 데이터셋을 선택했는데, 명확하게 원하는 데이터가 없을 경우 지금 진행 중인 대회의 데이터를 다뤄보는 것이 의미가 있을 것이라 생각되었기 때문이다.
데이터사이언티스트 AI 컴피티션
6만 AI팀이 협업하는 인공지능 플랫폼
dacon.io
우선 미니프로젝트 시각화가 목적이므로 각 변수들을 파악해본 후 스스로 궁금한 점들을 3가지 추려보았다.
간단하게 데이터를 다듬고 plotly시각화를 일부 진행했는데 다중 인덱스로 만든 데이터프레임의 그래프를 만드려고 시도했던 것이 오류가 발생해 해결하지 못하고 시간을 많이 소비했다.
가장 중요한 점은 마감기한 내 완성이기 때문에 원하는 모든 것을 챙길수 없다면 적당한 타협이 필요할 것 같다. 완성하는데 의미를 두고 한주 수업의 마지막을 잘 마무리해야겠다.
'Journal' 카테고리의 다른 글
빅데이터 분석가 양성과정 37일차 (0) | 2022.08.23 |
---|---|
빅데이터 분석가 양성과정 36일차 (0) | 2022.08.22 |
빅데이터 분석가 양성과정 34일차 (0) | 2022.08.18 |
빅데이터 분석가 양성과정 33일차 (0) | 2022.08.17 |
[데이터 분석가 현직자 직무멘토링] 3차 (0) | 2022.08.16 |