본문 바로가기
빅데이터

제2회 빅데이터분석기사 실기시험 후기 & 문제 복기

by 수퍼스타 2021. 6. 25.

2021.04.17 - [빅데이터] - 제2회 빅데이터분석기사 필기시험 후기

2021.04.18 - [빅데이터] - 제2회 빅데이터분석기사 필기시험 문제 복기

2021.05.10 - [빅데이터] - 제2회 빅데이터분석기사 필기시험 결과확인 & 증빙자료 올리기

 

1. 실기시험 관련 공지사항

2021. 6. 19. 시험을 앞두고 2021. 4. 19. 공식 홈페이지에 문제 유형과 배점, 예시문제가 공지사항을 통해 공개되었습니다. 문제는 단답형과 작업형으로 나뉘고, 작업형은 간단한 제1유형 3문제, 조금 복잡한 제2유형 1문제였고, 각 유형별로 한 문제씩 예시문제도 제공 되었습니다.

 

2. 실기시험 준비 과정

실기시험을 준비하기 위해 가장 먼저 언어를 선택해야 했습니다. 최근에 파이썬을 공부하고는 있지만 아직 데이터 분석에 필요한 라이브러리는 익히지 못해서 잘 알고 있는 R을 선택했습니다. 그래도 오랜만이라고 간단한 함수 외에는 기억이 나지 않아서 예전에 사두었던 책을 찾아보면서 예시문제를 풀어보았습니다.

시험 환경인 클라우드 기반 코딩 플랫폼을 처음 접하다보니 예시문제를 풀면서 많이 당황했는데, 자동완성도 없고 오류가 발생하는 이유를 알려주지도 않아서 익숙한 환경인 'R 스튜디오'와는 너무 달랐습니다. 그렇다보니 꼭 익혀야하는 패키지와 함수(예를 들면, dplyr이나 caret, e1071 등)들은 아무 것도 보지 않고 작성할 수 있도록 처음부터 여러번 풀어보면서 외우는 방식으로 공부를 했습니다. (실제 출제된 문제가 예시문제와 큰 차이가 없다보니 거의 암기과목... 같았고, 이렇게 공부한게 맞는 방법이었던 것 같습니다.)

 

3. 실기시험 후기

저는 실기시험을 강남역 인근의 더조은컴퓨터아카데미에서 봤는데, 주변에만 해도 같은 회사의 다른 응시장이 많았던 걸로 보아서 응시인원이 꽤 많았던 것 같습니다. 제가 들어간 시험장에는 전체 20명 정도의 인원 중 약 12명 정도 응시했습니다.

시험을 앞두고 메모장 사용 가능, 화장실 사용 시간 등 진행에 필요한 내용을 공지했는데, 시험장 관리 감독에 있어서 상당히 허술한 부분이 많다고 느꼈습니다. 메모장만 이용 가능하다고 했지만 시험 응시 전부터 컴퓨터를 사용할 수 있었기 때문에 시험 전에 메모장에 외워온 내용을 다 적어놓는 분도 있었을테고, 화장실 이용자에 대한 통제가 소홀해 화장실에서 부정 행위를 충분히 저지를 수 있을 것 같았습니다.

시험 결과 발표는 2021. 7. 16. 입니다. 합격은 하겠지만... 이 자격증이 빅데이터 분석가임을 증명해 주는 자격증이 되기는 어려울 것 같네요. 또 역시나 취업에 큰 도움은 되지 않을 것 같다는 생각이 듭니다. 그래도 시간과 관심만 있다면 누구나 3~4달 공부해서 취득할 수 있으니 관심 있으신 분들은 너무 많은 시간 쏟지 않으시고 합격하시기를 바라봅니다.

(역시 자격증 시험은 1회가 편합니다.)

 

4. 실기시험 문제 복기

시험이 어렵지는 않았지만 짧게 준비하느라 모든 문제를 완벽하게 풀지는 못했고, 합격선은 넘겼다는 확신이 있어서 적당히 풀고 나왔습니다. 

시험문제를 복기하려고 하니 시험을 보고 바로 일주일 여행을 다녀오느라 기억이 가물가물합니다. ㅠㅠ 기억나는 대로 정리해보면 단답형에서는 앙상블 분석의 모형 이름을 묻는 문제가 몇 개 있왔고, 제1유형은 데이터 전처리 후 평균이나 합계 등을 구하는 문제, 제2유형은 예시문제와 거의 유사한 문제가 나왔습니다. 현재 생각나는 것과 다른 분의 글을 참고해서 작성했습니다.

<단답형>

변수선택법 / 이상치 / 결측치 대체 방법 / 앙상블 모형(Ada boost, GBM) / 반응함수 계산 / 비지도학습 / ROC Curve / 과적합

<제1유형> 

상위 10개 값을 상위 10번째 값으로 대체하고 평균 계산 / 이상치 판별 후 이상치 합계 계산 / 결측치 대체 후 대체 전후 표준편차 차이 계산

<제2유형>

택배 배송 정시 도착 여부를 계산하는 문제였는데, 기억나는건 수치형으로 보이는 변수(다른 level은 다 숫자인데 한 개 level만 " *7 "이라고 입력되어 있었음.)가 범주형으로 되어 있었는데, 범주형으로 모형 만들었을 때보다 수치형으로 바꿨을 때 AUC가 더 높게 나와서 수치형 변수로 변환했고, SVM과 랜덤포레스트 모형은 계속 오류가 나길래 때려치우고 의사결정나무 모형으로 결과 작성해서 제출함.

댓글