전 세계에 휴대전화와 PC가 널리 보급된 지금, 빅데이터는 가장 중요한 데이터로 떠오르고 있다. 21세기 정보사회에서 빅데이터는 우리 삶의 모든 영역에 침투해 있어, 매우 중요하다. 그러나 아직 많은 이에게 빅데이터라는 개념이 낯설게 다가올 것이다. 따라서 우리에게 익숙한 OTT 서비스인 넷플릭스를 예로 들어 빅데이터가 무엇인지, 그리고 어떻게 활용되는지 알아보고자 한다.
빅데이터는 말 그대로 많은 양의 데이터를 뜻한다. 과거에는 우리가 직접 슈퍼마켓에 가서 물건을 사면 그와 관련된 데이터만이 저장되었다. 이는 아날로그 환경에서의 데이터이다.
하지만, 인터넷 이용이 활발해지면서 이제는 온라인 사용자가 남긴 사소한 족적까지도 모두 데이터로 수집된다. 그 결과, 매우 많은 양의 데이터가 생겨났다. 이것이 바로 빅데이터이다.
빅데이터 기술을 이용한 넷플릭스의 콘텐츠 추천
넷플릭스 사용자라면, 특정 영화나 드라마를 시청한 후 비슷한 장르의 콘텐츠를 추천받은 경험이 있을 것이다. 이는 정교한 빅데이터 기술을 이용하여 만든 추천 알고리즘 때문에 가능한 일이다. 이 추천 알고리즘은 넷플릭스의 강점이며, 매출의 상당한 부분을 차지하고 있다.

그렇다면, 넷플릭스는 어떻게 추천 알고리즘을 만들었을까? 핵심은 바로 빅데이터 분석에 있다. 넷플릭스의 사용자는 약 1억 5,000만 명인데, 이들의 콘텐츠 시청 기록뿐 아니라 동영상 시청 도중 일시 정지 또는 되감기 등 모든 이용 행태가 많은 양의 데이터, 즉 빅데이터로 축적된다.
그리고, 넷플릭스는 바로 이 빅데이터를 분석함으로써 추천 알고리즘을 만드는 것이다. 이 작업에는 넷플릭스의 자체 운용 시스템인 마이크로 장르 시스템이 이용된다. 마이크로 장르 시스템을 통해 넷플릭스는 각각의 영화별로 수많은 메타데이터를 태그하고 이로써 다양한 장르를 카테고리화한다.
여기서 메타데이터란 다른 데이터를 설명해 주는 데이터로, 콘텐츠의 위치와 내용, 작성자에 관한 정보 등을 알려 주는 데이터를 말한다. 이렇게 해서 만들어진 다양한 장르들이 이용자들의 취향에 맞게 추천되는 것이다.
그리고, 이와 같은 빅데이터 기술은 넷플릭스 ‘오리지널 콘텐츠’의 성공에도 큰 공헌을 했다. 스트리밍 서비스만을 제공하던 넷플릭스는 이용자들의 콘텐츠 기록 빅데이터를 분석하고 이를 바탕으로 그들의 기호에 맞을 만한 콘텐츠를 직접 제작하였는데, <하우스 오브 카드>와 <오렌지 이즈 더 뉴 블랙>이 대표적인 사례이다.
이 두 콘텐츠는 이용자들로부터 열광적인 반응을 얻으며 넷플릭스 오리지널 콘텐츠의 저력을 보여주었고, 2021년 현재에는 훨씬 더 많은 자체 제작 콘텐츠들이 쏟아지는 중이다. 콘텐츠 시장에서 넷플릭스가 거둔 성공은 21세기 정보화 사회에서 빅데이터가 가지는 중요성을 잘 보여 준다.
[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]