본문 바로가기
Journal

빅데이터 분석가 양성과정 24일차

by statsbymin 2022. 8. 3.

이번 수업에는 행정안전부, 공공데이터 포털, 티머니 등의 사이트에서 공공데이터를 활용해 시각화하는 실습을 진행했다.

지역별 인구, 성별 분포, 시간대별 지하철역 승하차 인원수 등을 시각화해보며 정보를 추출해 볼 수 있었다.

 

 

D컬럼부터 0세 인구수이다. Python 인덱스로는 [3]

우리 동네 인구 구조 시각화하기

import csv
f = open('age.csv')
data = csv.reader(f)
result = []
name = input('지역 이름 입력 : ')
for row in data:
    if name in row[0]:
        for i in row[3:]:
            result.append(int(i.replace(',','')))
            
plt.style.use('ggplot')
plt.rc('font', family = 'Malgun Gothic')
plt.title(name + '지역의 인구 구조')
plt.plot(result)
plt.show()

 

지역의 성별 인구 분포 시각화

import csv
f = open('gender.csv')
data = csv.reader(f)

m = []
f = []

name = input('지역 이름을 입력하시오 : ')
for row in data:
    if name in row[0]:
        for i in row[3:104]:
            m.append(-int(i))
        for i in row[106:]:
            f.append(int(i))
            
plt.style.use('ggplot')
plt.figure(figsize=(10,5), dpi=300)
plt.rc('font', family = 'Malgun Gothic')
plt.rcParams['axes.unicode_minus'] = False
plt.title(name +'지역의 남여 성별 인구 분포')
plt.barh(range(101), m, label = '남성')
plt.barh(range(101), f, label = '여성')
plt.legend()
plt.show()