
빅데이터 사용 추세가 증가함에 따라 이를 분석하는 기술도 자주 언급된다. 특히, 많은 양을 다루는 SNS 기업에서 오픈 소스 통계분석 프로그램인 R을 핵심 분석 엔진으로 활용하면서 R이 데이터 분석 업계의 최대 이슈로 떠오르고 있다.
R은 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경이다. 사용자는 다양한 통계 분석 기법과 데이터마이닝 기법을 사용할 수 있으며, 운영체제에 영향을 받지 않고 무료로 사용할 수 있다.
최근, 통계 소프트웨어 개발과 자료 분석에 널리 사용되고 있으며, 사용자가 제작한 패키지를 추가해 기능을 확장할 수 있다는 장점이 있다. 더불어 R은 그래픽 기능으로 수학 기호를 포함할 수 있는 그래프를 제공한다. 또한, 통계 계산과 소프트웨어 개발을 위한 환경이 필요한 통계학자뿐만 아니라 행렬 계산을 위한 도구로써도 사용된다.
R의 기능은 크게 네 가지이다. 자료의 구성과 정렬 결합 등 프로그램 처리로 쉽게 이루어지는 자료 처리 기능, 자료를 분석하는 데 필요한 수치적 계산 및 분석 결과를 제공하는 자료분석기능, 대화형 프로그래밍 언어로서 함수문을 쉽게 작성하고 C 언어 및 FORTRAN 언어 등의 인터페이스가 가능한 언어 기능, 대화형 그래픽스에 의한 자료 분석의 기능 및 분석 결과의 뛰어난 그래픽스 처리를 통칭하는 그래픽스 기능이 있다.
R은 이공계열 전공 수업뿐만 아니라 인문계열 전공 수업에서도 자주 찾아볼 수 있다. 따라서 개발 언어를 잘 모르는 초보자도 쉽게 접근하며, 유용하게 활용할 수 있다.
[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]