CWN(CHANGE WITH NEWS) - 데이터 과학 직종 구체적으로 살펴보기

  • 구름많음해남24.8℃
  • 구름많음거제24.5℃
  • 구름많음울릉도23.2℃
  • 구름많음의령군21.3℃
  • 구름많음태백14.9℃
  • 흐림수원24.4℃
  • 흐림부여22.9℃
  • 흐림충주22.2℃
  • 흐림장수18.7℃
  • 구름많음청송군18.0℃
  • 흐림거창19.0℃
  • 구름많음동해21.1℃
  • 구름많음고흥24.5℃
  • 구름많음보성군23.4℃
  • 구름많음영천20.2℃
  • 구름많음함양군19.9℃
  • 흐림속초22.1℃
  • 흐림홍성23.7℃
  • 흐림영월18.9℃
  • 흐림산청20.3℃
  • 구름많음상주21.0℃
  • 흐림고산26.0℃
  • 구름많음북창원24.1℃
  • 흐림보령26.0℃
  • 구름많음강진군24.0℃
  • 흐림고창23.4℃
  • 구름많음임실23.8℃
  • 흐림양평22.2℃
  • 구름많음순창군22.4℃
  • 흐림경주시22.7℃
  • 구름많음영덕21.1℃
  • 구름많음북강릉21.0℃
  • 구름많음진주21.4℃
  • 흐림철원20.2℃
  • 구름많음성산27.5℃
  • 구름조금북부산24.7℃
  • 흐림순천20.4℃
  • 구름많음백령도21.7℃
  • 구름많음양산시24.7℃
  • 흐림춘천20.4℃
  • 구름많음남해23.4℃
  • 흐림남원23.9℃
  • 흐림이천19.8℃
  • 흐림고창군25.2℃
  • 맑음창원23.5℃
  • 흐림제천20.5℃
  • 구름많음정선군17.0℃
  • 흐림군산23.9℃
  • 구름많음목포25.2℃
  • 흐림정읍23.7℃
  • 흐림파주20.9℃
  • 구름많음밀양24.5℃
  • 흐림서산23.3℃
  • 구름많음봉화17.0℃
  • 흐림청주25.5℃
  • 구름많음장흥23.9℃
  • 구름많음안동20.5℃
  • 흐림울산23.2℃
  • 구름많음세종23.4℃
  • 구름많음김해시24.1℃
  • 구름많음통영24.2℃
  • 흐림홍천20.1℃
  • 구름많음금산22.8℃
  • 흐림보은22.1℃
  • 흐림영주17.2℃
  • 흐림인제18.3℃
  • 구름많음대구22.2℃
  • 구름많음강릉21.6℃
  • 구름많음부산24.5℃
  • 구름많음추풍령19.6℃
  • 흐림강화22.7℃
  • 구름많음영광군23.3℃
  • 구름많음완도23.4℃
  • 구름많음서청주23.1℃
  • 구름많음천안22.9℃
  • 구름많음합천20.9℃
  • 흐림동두천21.7℃
  • 흐림흑산도24.5℃
  • 구름많음대전23.5℃
  • 흐림인천25.6℃
  • 비서귀포26.4℃
  • 흐림북춘천20.8℃
  • 구름많음울진21.4℃
  • 구름많음원주22.4℃
  • 구름많음포항23.9℃
  • 흐림대관령15.5℃
  • 구름조금전주23.9℃
  • 흐림광주23.6℃
  • 구름많음문경18.7℃
  • 구름많음진도군22.6℃
  • 구름많음의성18.9℃
  • 구름많음여수24.6℃
  • 흐림서울25.0℃
  • 흐림부안24.6℃
  • 비제주26.2℃
  • 구름많음광양시24.2℃
  • 흐림구미20.4℃
  • 2025.09.12 (금)

데이터 과학 직종 구체적으로 살펴보기

권수빈 / 기사승인 : 2021-03-03 13:53:18
  • -
  • +
  • 인쇄

21세기는 지적 정보화 사회로 과거의 단순히 세분되고 전문적인 것이 아닌 개인의 개성과 창의성을 바탕으로 구성된 정보와 창의적인 아이디어가 중심인 사회이다. 과거의 아날로그 환경과 달리 일상생활에서 PC, 인터넷, 모바일 기기 보급과 함께 데이터가 기하급수적으로 증가하고 있다. 데이터의 규모가 방대하고, 생성 주기도 짧아져 실시간으로 디지털 정보가 폭발적으로 증가한다.

하지만, 의미 없어 보이는 방대한 자료들을 분석해 정제된 데이터를 통해 지금까지 알지 못한 사실을 알아낼 방법이 있다. 바로 ‘빅데이터’ 덕분이다. 빅데이터는 새로운 경제적 가치와 혁신의 원천이자 미래 경쟁력의 우위를 좌우하는 중요한 자원이다.

하버드 비즈니스 리뷰는 데이터 과학자와 관련, "데이터의 홍수 속에서 헤엄치는 사람이다. 복잡한 대량의 데이터를 구조화하면서 분석할 수 있도록 만든다. 데이터 소스를 찾고, 불완전한 데이터를 서로 연결하여, 깔끔한 결과를 보인다"라고 설명했다.

데이터 과학자를 구체적으로 분류하자면 일반적으로 비즈니스 분석가, 데이터 분석가, 데이터 엔지니어, 머신러닝 엔지니어로 나눌 수 있다. 각각의 역할 정의는 기업마다 다르다.

데이터 분석가는 기획자적 성향, 데이터 엔지니어는 개발자적 성향, 데이터 과학자는 연구자적 성향, 머신러닝 엔지니어는 개발자적 성향이 강하다고 볼 수 있다. 각각의 직무에 따른 역할을 아래와 같이 설명한다.

비즈니스 분석가
도메인에 대한 전문성이 높다. 이미 정제된 데이터를 통해 인사이트를 발견하고 의사결정을 할 수 있는 결과물을 만든다. 주로 전략이나 사업 관련 부서에서 근무하며 프로그래밍보다 엑셀과 같은 툴을 주로 사용한다.

데이터 분석가
코딩 기술과 비즈니스 경험, 도메인에 대한 전문성이 필요하다. 데이터를 정제하고 분석할 수 있어야 하며, 머신러닝 등의 기술을 이용해 예측 모델을 만들 수 있어야 한다.

데이터 엔지니어
데이터베이스를 안정적으로 운영할 수 있어야 한다. 데이터를 수집, 가공해 데이터 분석가가 사용하기 쉽게 저장한다. 대용량 데이터에 대해 분산처리 기술을 사용한다. 컴퓨터 공학 쪽 역량이 많이 필요하며 SQL, 유닉스, 리눅스 등에 익숙해야 한다.

머신러닝 엔지니어
자신이 속한 도메인에서 필요한 모델을 개발한다. 개발한 모델을 실제 제품에 적용하고 이를 모니터링하여 성능을 개선한다.

데이터 과학자
보통 R&D 조직에 속하고 논문을 연구한다. 데이터 분석 관련 업무를 한다면 통계 모델링을 수행한다.


데이터 엔지니어와 데이터 사이언티스트는 협업을 한다. 회사에 따라 업무에 대한 배분이 달라진다. 위의 그래프를 보면 고급 프로그래밍, 분산 프로그래밍, 데이터 파이프라인 업무는 비교적 덜 겹치지만 분석, 프로그래밍, 빅데이터는 상당히 겹친다.

기본적으로 자신이 가지고 있는 역량뿐만 아니라 관심 있는 도메인, 강화하고 싶은 역량에 따라 세분화된 직업이 정해질 것으로 보인다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue