Journal
빅데이터 분석가 양성과정 33일차
statsbymin
2022. 8. 17. 07:06
캐글에 있는 브라질 olist 이커머스 데이터셋을 활용해 pandas를 활용한 데이터 전처리, plotly를 활용한 데이터 시각화 위주로 하루를 보냈다.
https://www.kaggle.com/datasets/olistbr/brazilian-ecommerce
Brazilian E-Commerce Public Dataset by Olist
100,000 Orders with product, customer and reviews info
www.kaggle.com
데이터를 파악해보고 EDA를 위해 탐색하고자 하는 질문들을 설정하고 시각화를 통해 정보들을 도출하였다.
( 고객은 주로 어떤 지불방법을 사용할까?, 날짜(월, 주, 일) 별 판매 트렌드는? 등)
위 그래프는 월별 매출액을 시각화한 것으로 2017년 11월 매출이 가장 높은 것을 확인할 수 있었다.
plotly라이브러리의 시각화가 가장 깔끔하지만 다른 시각화 라이브러리에 비해 복잡한 느낌이 있어 적응이 필요했다.