4차 산업혁명 시대를 맞이하면서 인공지능(AI), 임베디드 시스템 등 새로운 기술이 개발되었다. 그중 빅데이터는 현대 사회의 수많은 데이터를 생성, 수집, 저장, 분석, 표현하면서 끊임없이 변화하는 사회를 더욱 정확하게 예측하고 효율적으로 대처하기 위한 기술이다. 현재는 주로 코로나바이러스 백신 개발과정에서 수많은 데이터 수집, 분석과 같은 중요한 업무에 활용된다. 빅데이터 기술이 매우 유용하게 사용되는 지금, R 언어가 새롭게 주목받고 있다.

R 언어는 1993년 뉴질랜드 오클랜드대학의 로스 이하카(Ross Ihaka)와 로버트 젠틀맨(Robert Gentleman)이 개발한 통계 및 그래프 작업을 위해 만들어진 인터프리터 프로그래밍 언어이다. R 언어는 빅데이터 기술의 프로그래밍 언어로 주로 사용되고 있다. R 언어가 빅데이터 분야의 주요 언어가 된 이유는 무엇일까?
R 언어의 매우 중요한 특징인 데이터 시각화를 언급할 수 있다. 데이터 시각화란 데이터 분석 결과를 도표, 그래프로 표현하는 것과 같이 쉽게 이해할 수 있게 시각적으로 표현하여 전달하는 것을 의미한다. 데이터 시각화를 이용하면, 데이터를 효율적으로 분석할 수 있다.
또 다른 특징으로 패키지 개발이 용이하다는 점이 있다. R 언어를 이용하다 개발자가 원하는 기능을 추가하고 싶다면 자유롭게 개발하여 기능을 추가할 수 있으며, 다른 개발자들이 만들어 놓은 기능을 가져와 사용할 수 있다.
마지막으로 R 언어는 프로그래밍하기 매우 쉬운 언어라는 특징도 지니고 있다. R 언어를 개발한 이하카와 젠틀맨 모두 통계학자로 컴퓨터를 전문적으로 다룬 개발자가 아니다. 이들은 R 언어를 개발자용이 아닌 효율적인 통계 목적으로 개발했으며, 이후 프로그래밍하기 쉽게 R 언어를 제작했다. 이 덕분에 R 언어는 빅데이터 기술의 주요한 프로그래밍 언어로 자리 잡고 있다.
현대 사회에는 수많은 데이터가 존재하고 데이터들은 사람들의 삶에 많은 영향을 미친다. 쉽게 배울 수 있는 R 언어를 이용하여 나에게 필요한 데이터를 효율적으로 분석해 보는 건 어떨까?
[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]