자격증/IT·전산·보안

[빅데이터분석기사] 시험정보 / 후기 / 합격률 / 공부방법

SecurityMan 2022. 3. 19. 09:00

2021년 5월 취득한 빅데이터분석기사

 

SQLD 처럼 데이터산업진흥원에서 주최하는 시험이다.

 

첫 시행인 2회차에 바로 취득했다.

왜 첫 시행이 1회차가 아닌 2회차냐면, 2020년 12월 시행 예정이던 1회차 시험이

코로나 확진자 폭증으로 취소되었기 때문..

 

시험이 취소되면 다음시험부터 1회차로 카운트 할줄 알았는데

1회차를 영구결번으로 만들어버렸다.

솔직히 좀 아쉽다.. 1회차 합격이라해야 멋진데

코로나만 아니었어도..

 

참고로 빅데이터분석기사는 다른 국가기술자격처럼 '수첩형' 자격증이 제공되지 않는다.

수첩형을 받고싶어서 위처럼 직접 문의해봤으나 편의와 비용을 고려하여 제공하지 않는다고 한다.

수험자 입장으로서 수첩형 너무 갖고싶은데.. 누구의 편의인가..

 

암튼 수첩형은 없으니 자격증 취득하면 홈페이지에서 각자 출력해서 사용하면 된다.

(편리하긴 하다.)

 

필기시험 결과는 진짜 아슬아슬했다.

평균 60점 이상 각 과목별 40% 미만 과락인데

시험결과 평균 60점에 2과목은 딱 40%만 맞았다.

한문제만 삐끗했어도 필기는 떨어졌을껀데 정말 천운이 따랐다.

운좋게도 찍은 문제들이 많이 맞았던것 같다.

 

내가 컴퓨터를 전공하긴 했지만 빅데이터는 확실히 다른 분야라고 필기시험을 통해 느꼈다.

특히나 힘들었던건 통계학... 수년전 고등학교에서 배웠던 통계학 지식을 끄집어내서 공부하는게 힘들었다.

(참고로 2과목이 통계학이다. 점수로 증명했다.)

 

반응형

 

시험치고나서 각종 커뮤니티들에 후기를 읽어봤는데 

쉬웠다, 무난했다는 평이 많아서 띠용? 했다. 아니 나는 엄청 어려웠는데..

이때 당시에 어떤분께서 데이터산업진흥원에 합격률을 문의했었는데 40% 정도라고 답변을 받았다.

첫 시행이라 통계쪽에서 일하시는 분들이나 전공하신 분들이 많이 쳐서 그럴수도 있겠다는 생각을 했다.

 

암튼 확실한건 통계쪽, 데이터쪽 전공자가 아니면 확실히 어렵다.

 

첫시행이라 그런지 시험에서 이슈도 있었는데, 복수정답 문제가 2문제나 있었다는것

시험문제 풀때도 '좀 이상한데..' 생각하면서 고민해서 풀었었는데 역시나 문제오류였다.

 

결국 해당 문제들은 결국 복수정답 처리가 됐다. 조금 성적이 오를까 기대했었는데

알고보니 나는 맞춘 문제들이라 아무런 영향이 없었다..ㅎ

 

실기는 오히려 쉽다는 생각이 들었다.

 

실기시험은 단답형 10문제, 작업형 1유형 3문제, 작업형 2유형 1문제로 총 14문제가 나온다.

역시나 통계학적, 데이터분야 지식이 부족해서 단답형은 4개밖에 못맞췄다...ㅎ

 

작업형은 R, Python 중에 언어를 선택해서 코딩하는 문제이다. 

나는 Python을 선택해서 풀었다.

Python을 선택할거면 numpy, pandas 같은 데이터분석에 특화된 모듈의 기본 사용법을 숙지하고 가면 좋다.

 

작업형 1유형은 간단한 문제들이다.

뭐 예를들자면 어떤 데이터가 주어지는데

해당 데이터의 평균을 구하시오

해당 데이터의 중간값을 구하시오

뭐 이런 느낌이다. 위의 예처럼 단순하진 않은데 충분히 고민해서 풀 수 있는 문제이다.

 

어느정도냐면 pandas 사용법을 숙지한다면, 3~4줄이면 코딩이 다 끝나는 수준이다.

만약 pandas 사용법을 모른다 하더라도

평균을 구한다 치면 for문을 이용해서 데이터 다 더하고 갯수 구해서 나누기하는거 코딩하면 된다.

 

나도 어떤 문제는 pandas 함수 이름이 기억나지 않아서 조건문 6개씩 써가며 코딩했었다...

이런 불상사를 막으려면 주요 함수 이름은 외워가도록 하자..

 

작업형 2유형은 엄청나게 복잡하다.

역시나 코딩을 하는 문제인데 훈련데이터가 주어지고,

훈련데이터를 결측값, 이상값 등을 적절히 전처리 한뒤 학습시키고나서

테스트 데이터로 값을 예측하는 문제가 나온다.

 

기억이 가물가물한데 2회차에 나왔던게 고객의 쇼핑데이터를 제공하고,

이 사람이 환불을 할 사람인지 예측해서 분류하는 문제였던거 같다.

 

실기문제도 이슈가 있었는데 0점으로 채점된 사람들이 있어서 단체로 민원을 넣었더니

진흥원 측에서 채점오류를 인정하고, 전면 재채점해서 다시 성적을 공지했었다.

그 덕에 나도 2유형이 원래 20점이었는데 30점으로 오르게 됐다.

 

아무튼 2유형은 진짜 어려우니 시간을 많이 투자하는게 좋다.

 

나는 시대고시기획에서 출판한 빅데이터 분석기사 필기 한권으로 끝내기 책을 이용해서 공부했다.

지금 공부를 시작하는 사람들은 이 책을 쓰진 않겠지만

혹시나해서 말하자면 이책 진짜 별로다.

 

나는 왜 이 책을 샀냐면, 원래 2020년 12월 시험을 보려고 9월쯤에 서점에 갔는데

그때는 이 책밖에 없었다.. 젤 먼저 출판한 책... 그래서 그냥 사서 공부했다.

 

이 책이 문제인 이유는 시험 내용에 나오는 내용들이 이 책에는 없다.

(붓스트랩, 부스팅 등)

그래서 시험장에 가서 엄청 당황했던 기억이 난다.

 

지금은 어느정도 자격증시험이 시행되면서 책들이 조금씩 정제되었을테니 상관없을거 같다.

 

초반이라 실기시험 책은 없었다.

데이터산업진흥원에서 실기시험 전에 공지사항에 실기 예시문제를 올려줬었다.

(공지사항 링크 : https://www.dataq.or.kr/www/board/notice/list.do 758번 게시물)

 

여기에 작업형 문제 예시도 같이 주어졌는데

당시 유튜브에 작업형 2유형 풀이를 올려주는 분들이 몇분 계셨었다.

 

나는 그분들중 2~3분의 풀이를 메모장에 받아적어서 프린트 한뒤,

그 풀이(소스코드)들을 달달달 외워서 시험장에 들어갔다.

 

정말 운이 좋게도 예시문제가 분류형으로 로지스틱 회기를 쓰는 문제였는데

시험문제도 똑같이 로지스틱 회기를 쓰는 문제가 나왔다.

 

그래서 변수명만 조금 바꿔서 외웠던 코드 그대로 쓰고 나왔고 40점 만점에 30점을 받았다.

세부적인 조정은 하나도 안했으므로 나머지 10점은 분류정확도 이런곳에서 뺀거 같다.

 

나는 그전부터 Python을 쓸줄 알았기에 그냥 코드만 외워서 갔지만, 

비전공자거나 Python 경험이 없다면 Python 기초도 확실하게 배워서 가는걸 추천한다.

반응형