Certificate/빅데이터 분석기사

빅데이터 분석기사 최종 합격 후기

statsbymin 2022. 7. 8. 22:30

이번 6월 25일에 응시했던 제4회 빅데이터 분석기사 실기시험 결과가 공개되었다. 최종 합격 발표일은 7월 15일이지만 오류 및 이의제기 가능성을 염두해 1주일 앞서 발표한 듯 보인다.

 

점수 분배의 경우

단답형 - 30점

더보기

10문제 모두 각 3점으로 이루어져 있으며 1개 틀릴 때마다 3점씩 감점

작업형 제 1유형 - 30점

더보기

데이터 전처리에 대한 작업 문제가 출제되며 부분점수 없이 제출한 답 결과와 형식이 조금이라도 다를 경우 0점 처리되어 문제당 0 혹은 10점을 받게 된다.

작업형 제 2유형 - 40점

더보기

전처리 및 모델링 후 최종 예측으로 40점 만점을 기준으로 F1 Score 값을 기준으로 일정 수준 이하일 경우 10점씩 감점하는 형태로 예측된다.(5점 단위는 본 적이 없는데 100% 정확한 건 아니다)

으로 구성되어 있다.

 

시험 결과

시험을 치고 난 직후 점수를 예상했을 때 단답형 18점(6/10문제), 작업 1 유형 20점(2/3문제)에 작업 2 유형의 경우 정확한 채점 기준을 몰라 전혀 예측할 수 없었기에 불합격을 예상하고 있었지만 특이하게도 작업형 1 유형에서 2문제를 틀려버렸다.. (답은 맞았는데 조건을 다 만족시키지 못했을 것으로 추측된다.) 그럼에도 모델링에서 40점을 받으며 아슬하게 통과할 수 있었다. 

 

 

시험 소소한 공략 및 팁

팁을 주기에는 미천한 점수지만 빅데이터 분석기사에 응시 예정인 사람들에게 소소한 팁들을 몇 자 적어보려 한다.

비전공자(문과 등)분들의 경우 완벽한 이해보다는 시험 합격을 위한 적절한 공략이 필요하신 분들이 많을 듯하다.

우선 교재의 경우 필기, 실기 책 모두 데이터에듀의 교재로 공부하였다.

 

http://www.dataedu.kr/

 

데이터에듀 | ADP ADsP | 데이터분석 수험 빅데이터 전문 기업 – ADP, ADsP 빅데이터교육 1위 데이터

데이터에듀는 온라인 빅데이터 교육 전문 기업으로 빅데이터 /AI 분석 솔루션 개발과 컨설팅을 제공하고 있습니다.

www.dataedu.kr

 

필기시험

학교 도서관에서 이기적, 수제비 교재도 대여해 잠깐 본 적이 있지만 개인적으로 ADsP도 데이터에듀의 교재로 재미를 봤었기 때문에 익숙한 면이 있었다. 그리고 아직 신생 기사시험이다 보니 필기시험에 대해 출판사들의 예측력이 크게 떨어지는데 다양한 모의고사와 최근 기출 복원 문제가 있어 문제 풀기에는 좋을 듯하다. (사실 필기는 많이 보는 게 답.)

 

실기시험 

파이썬을 사용한다면 프리렉, 둘 다 궁금하다면 이기적, R을 사용한다면 이기적 혹은 데이터에듀를 추천한다. 프리렉의 경우 단답형 및 작업형 모두 알기 쉽고 가시성 있게 정리되었다는 점에서 구매자들에게 좋은 평가를 받았다. 추가로 다른 책 하나를 더 구해 볼 수 있다면 2가지 종류의 책을 보며 다양한 방법의 코드를 확인해 보는 것이 좋다. R의 경우 교재가 많지 않아(데이터에듀, 이기적, 수제비 정도) 2가지를 선택해 필요한 코드를 찾아보며 공부하는 것을 추천한다.

 

합격점수가 60점이기 때문에 단답형의 경우 12점, 21점, 30점이 가장 가성비가 좋다. (물론 합격 목표 기준이고 당연히 12점 보다는 15,18점이 낫긴 하다.) 왜냐하면 나와 같은 경우처럼 단답형에서 18점을 받았지만 작업1,2 유형에서 총 40점을 받을 경우 58점이지만 21점을 받았을 경우 61점이다. 즉 시험 통과에 초점을 두고 본다면 10점 단위로 변경되는 점수에서 8점은 아무런 의미가 없게 된다. 30점의 경우 시간 투자를 정말 많이 해야 되고 실질적으로 노려볼 수 있는 점수는 12,21점인데 본인이 필기가 많이 어려웠다고 판단되면 12점(웬만하면 12점은 나온다)을 목표로 작업형에 시간을 투자하는 것을 추천한다. 기본적인 내장 함수 기능과 전처리 기능(R의 경우 dplyr 라이브러리, Python의 경우 numpy, pandas정도)을 잘 다룰 수 있다면 20점 이상 받을 수 있을 것이다.

작업 2유형 모델링에서는 앙상블을 활용한 분석 방법을 활용하는 게 좋다. 분류 문제 기준으로 앙상블 기법 알고리즘인 randomForest : 배깅, XGBoost, LightGBM : 부스팅 등을 활용하는 게 좋을 확률이 높다. 아무래도 약한 분류기들을 결합하기 때문에 안정성 및 일반화 가능성에서 유리할 수밖에 없다. 2가지 정도(시간이 부족하면 1가지) 모델을 돌려본 후 F1 Score 값을 확인하고 더 높은 모델을 선택하면 된다.

마지막으로 시험 환경의 경우 평소 사용하는 RStudio, Jupyter Notebook, Colab 등과 다르게 자동완성 기능이 없고 단축키도 활용 불가능하며 사소한 불편함들이 많기 때문에 꼭 시험환경을 체험해 보기 바란다.

 

체험환경

https://dataq.goorm.io/exam/116674/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/1

 

구름EDU - 모두를 위한 맞춤형 IT교육

구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/

edu.goorm.io

https://www.dataq.or.kr/www/board/notice/list.do

 

데이터자격시험

 

www.dataq.or.kr