Home [회고] 2022년을 되돌아보며
Post
Cancel

[회고] 2022년을 되돌아보며

들어가기 앞서

이번 2022년은 저에게 있어 참으로 뜻깊고 즐겁고 치열한 한 해로 남습니다.

빠르게 회고해보자면 다음과 같아요!

  1. 국비교육 수강
  2. 1개월 간의 인턴
  3. 첫 취업!

1. 국비교육 수강: 데이터에 대해 조금 더 배워보자

문제풀이 회고 글에서 얼핏 확인하실 수 있겠지만 상반기 동안 국비교육을 수강하였습니다.

당시에는 프로젝트형빅데이터분석서비스개발, 현재는 \[멀티잇\]데이터 분석 서비스 개발자 취업캠프(융합PJT) 라는 교육이었습니다.

약 5개월 동안 대면과 비대면을 번갈아가며 수강하였습니다.

국비교육 출석사진 [그림01] 국비교육 출석사진

(결석 2회는 예비군 1회, 마지막날 퇴실을 놓쳐서 1회입니다)

커리큘럼: 기초부터 차근차근

  • HTTP, CSS, JavaScript 등 웹 기초
  • Python 기초 및 Django 활용 서비스 개발 (1차 프로젝트)
  • R 기초와 분석 기법 및 시각화 (2차 프로젝트)
  • Python 활용한 분석 기법 및 시각화
  • 사물인터넷‧클라우드‧빅데이터‧인공지능 4개 분야의 융합 프로젝트 (최종 프로젝트)

장점: 데이터 분야의 시작점 + 타분야와의 협력 경험

  • 비전공자여도 강의 수강 및 기술 습득에 큰 걸림돌이 없는 난이도
    • 당시 강사님께서는 수강생들의 거의 모든 질문에 답변을 해주시려 노력하셨습니다.
    • 또한 최종 프로젝트는 멘토링 시간이 주마다 존재하여 프로젝트 내용 외에도 각종 기술, 현업에서의 고려 사항, 취업 조언 등 빠른 피드백이 가능했습니다.
  • 데이터 분야에 관심이 있다면 강의 수강을 통해 더 깊은 이해 가능
    • 데이터 분야 안에서도 대략적으로 나뉘는 갈래를 확인할 수 있습니다.
    • 막연하게 데이터 분야가 아니라, 데이터 분석, 데이터 엔지니어링, 데이터 사이언티스트 등 세부 분야에 대해 고민하게 됩니다.
  • 프로젝트 3번의 협력 경험
    • 최종 프로젝트는 IoT, Cloud, AI 등 명확하게 알지 못하는 분야와의 협업이 필수적입니다.
    • 협업 전반에 걸쳐 끊임없이 의견을 교환하고, 대립이 발생하면 토론하며, 서로에게 부족한 부분은 채워나갔습니다.
    • 당시 만난 분들과 여전히 연락을 하며 지내고 있습니다. 좋은 사람들과 만나는 일을 언제나 즐겁더라구요!

단점: 이미 길이 정해져 있다면, 혹은 여유가 없다면

  • 방대한 분야 대비 깊지 않은 접근
    • 저는 전공자였고, 데이터 분야 중 데이터 엔지니어링에 관심이 있는 상태로 강의를 수강하였습니다.
    • 그 덕분에 커리큘럼에 있는 내용 중 상당 부분은 알고 있는 지식이었습니다.
    • 데이터 엔지니어링과 관련된 기술을 얻기는 어려움이 있었습니다.
  • 5개월의 강의 기간
    • 개인에 따라서 다르겠지만 5개월의 강의 시간은 다소 길게 느껴질 수 있습니다.
    • 의지가 확고하다면 스터디 등 다른 경로를 고려해봄직 합니다.

2. 1개월 간의 인턴: 데이터 시각화와 분석을 들여다보다

위의 교육이 끝나자마자 데이터 시각화 전문기업인 뉴스젤리에서 인턴을 수행했습니다.

지원하게 된 계기는 데이터 분야 중 엔지니어링 외의 경험을 원했습니다.

약 1개월 동안 인턴을 수행하면서 토이 프로젝트를 수행하였습니다.

대시보드 제작: 뉴스젤리의 DAISY 툴을 활용하여

자전거 타기 좋은 시도가 어딜까?라는 주제로 수행하였습니다.

자전거 관련 통계를 수집하고, 자전거 대여소나 자전거 수리점 등 정보를 KAKAO API에서 가져왔습니다.

또한 자전거 관련 검색량을 가져오기 위해 네이버랩을 활용하여 데이터를 받고 이를 기반으로 검색량 추이를 계산하였습니다.

비록 참신한 주제는 아니었지만 스스로 데이터 분석을 해본 좋은 경험이었습니다.


3. 첫 취업!: 크라우드웍스에서의 5개월

올해 8월부터는 크라우드웍스에서 일을 시작하게 되었습니다.

제가 원하던 DE의 업무는 아니었지만, 5개월 동안 다른 부서와 협업을 통해 고객사의 니즈를 맞추는 것에 주력했습니다.

파이썬에 익숙해지다

파이썬을 주력 언어로 사용하다보니 익숙해지게 되었습니다.

예를 들어 딕셔너리들로 이루어진 리스트를 하나로 합칠 때, 다음과 같은 코드를 작성할 수 있습니다.

1
2
3
4
5
from functools import reduce


list_of_dicts = [{"1":1234}, {"a":5}, {1:777}]
print(reduce(lambda next, cur: dict(cur, **next), list_of_dicts))

생각하지 못 했던 사항을 고려해보다

현재 업무는 데이터 포맷을 변경하는 업무입니다.

그렇다보니 평소에는 생각하지 못 했던 사항을 고려하게 됩니다.

예를 들어 2GB 이상의 JSON 파일을 읽어야 했습니다.

파이썬의 기본 라이브러리로는 메모리 초과 오류가 발생하여 직접 라이브러리를 확인한 결과, 파일 포인터 기준으로 전체 텍스트를 읽어오는 코드가 있었습니다.

json 모듈 load [그림02] json 모듈 load

이를 해결하기 위해서는 파일의 iterable한 접근이 필요했고 ijson이라는 라이브러리를 찾아 해결하였습니다.

최근에는 멀티쓰레드를 사용한 파일에서 메모리를 지나치게 사용하는 것을 발견해서 확인 중입니다.


2023년에는 무엇을 할까??

내년 목표는 크게 3가지입니다.

  1. 블로그 데이터 기반의 파이프라인 작성하기
  2. 블로그에 조금 더 열심히 기록하기
  3. 운전면허 따기

이 글을 보는 여러분들도 2022년 열심히 달려오시느라 정말 고생 많으셨습니다.

2023년도 모두모두 건강하고 기운차고 목표를 모두 이루는 한 해가 되기를 소망합니다!! 😊

This post is licensed under CC BY 4.0 by the author.

220일 문제 풀이 여정의 끝과 새로운 시작

[Gibhub Action] Chirpy 업데이트 및 오류 해결

Comments powered by Disqus.