CWN(CHANGE WITH NEWS) - 2023년 데이터 마이그레이션 트렌드, 이 5가지 먼저 짚고 가자

  • 구름많음청송군23.8℃
  • 구름많음울릉도23.2℃
  • 흐림부여23.8℃
  • 구름많음서청주22.2℃
  • 흐림보은22.3℃
  • 흐림고흥24.5℃
  • 구름많음함양군24.6℃
  • 구름많음영주22.2℃
  • 구름많음거창25.1℃
  • 구름많음영광군24.9℃
  • 구름조금남원24.1℃
  • 구름많음강화22.1℃
  • 구름조금상주23.8℃
  • 구름많음인제20.9℃
  • 구름많음울진23.5℃
  • 구름많음충주23.2℃
  • 구름많음밀양25.3℃
  • 구름많음동두천23.2℃
  • 구름많음고창24.5℃
  • 구름많음산청24.2℃
  • 흐림동해22.1℃
  • 구름많음북창원25.6℃
  • 구름많음포항24.0℃
  • 구름많음창원24.9℃
  • 구름많음광주24.5℃
  • 흐림남해23.7℃
  • 흐림북강릉22.4℃
  • 흐림성산24.4℃
  • 맑음서산24.5℃
  • 흐림제주25.4℃
  • 구름많음임실23.0℃
  • 구름많음이천21.2℃
  • 구름많음양평21.2℃
  • 구름많음전주24.5℃
  • 구름많음부안24.8℃
  • 구름많음백령도23.3℃
  • 흐림정선군21.0℃
  • 흐림북부산26.2℃
  • 구름많음목포24.0℃
  • 구름많음고창군24.5℃
  • 구름많음속초23.3℃
  • 흐림청주23.2℃
  • 구름많음북춘천20.5℃
  • 구름조금철원23.3℃
  • 구름많음의령군24.0℃
  • 구름많음의성25.4℃
  • 구름많음합천24.5℃
  • 흐림강릉23.2℃
  • 구름많음구미
  • 흐림홍천21.3℃
  • 흐림강진군24.5℃
  • 구름많음진도군23.5℃
  • 구름많음태백20.6℃
  • 구름많음추풍령22.9℃
  • 흐림대관령17.6℃
  • 흐림김해시25.4℃
  • 구름많음서울23.7℃
  • 흐림서귀포26.4℃
  • 구름많음영천25.4℃
  • 흐림장흥24.3℃
  • 구름많음춘천20.5℃
  • 구름많음안동23.9℃
  • 구름많음진주23.8℃
  • 흐림대전22.3℃
  • 흐림세종22.2℃
  • 구름조금흑산도25.3℃
  • 구름많음순천24.4℃
  • 구름많음원주21.8℃
  • 흐림완도24.2℃
  • 흐림통영25.2℃
  • 흐림해남23.8℃
  • 구름많음천안22.4℃
  • 구름많음문경22.9℃
  • 흐림거제23.8℃
  • 흐림여수24.0℃
  • 흐림고산23.6℃
  • 구름많음인천22.5℃
  • 구름많음영덕24.0℃
  • 구름조금수원23.3℃
  • 구름많음장수22.1℃
  • 구름많음경주시24.7℃
  • 구름많음홍성23.2℃
  • 흐림광양시24.3℃
  • 구름많음울산25.8℃
  • 흐림부산25.6℃
  • 구름많음양산시26.1℃
  • 구름많음정읍25.0℃
  • 흐림보성군24.6℃
  • 구름많음금산23.7℃
  • 구름많음대구24.9℃
  • 흐림제천20.7℃
  • 맑음보령24.7℃
  • 구름조금순창군23.5℃
  • 구름많음파주23.3℃
  • 구름많음군산23.4℃
  • 구름많음봉화22.5℃
  • 흐림영월21.1℃
  • 2025.09.30 (화)

2023년 데이터 마이그레이션 트렌드, 이 5가지 먼저 짚고 가자

최정인 / 기사승인 : 2022-12-05 09:08:00
  • -
  • +
  • 인쇄

데이터 마이그레이션은 저장 시스템과 데이터베이스, 애플리케이션, 신규 서버 등을 이관할 때 종종 언급되는 비즈니스 프로젝트 안건이다. 데이터 마이그레이션 과정은 날이 갈수록 복잡해지는 추세이다. 이에, 외신 테크리퍼블릭이 2023년 주목해야 할 데이터 마이그레이션의 주요 동향 5가지를 설명했다.

첫 번째 트렌드는 데이터 레이크하우스(data lakehouse)로의 전환이다. 데이터 레이크하우스는 데이터브릭스(Databricks)가 처음 소개한 개념으로, 데이터 마이그레이션의 필요성 자체를 제거하는 데이터 마이그레이션 최대 혁신이다. 기존에는 데이터 레이크(data lake)에서 데이터를 추출, 변환, 적재해 데이터 웨어하우스(data warehouse)로 옮겼다면, 데이터 레이크하우스는 데이터 레이크를 데이터 웨어하우스로 변환한다.

데이터브릭스 임원 데이비드 메이어(David Meyer)는 인터뷰에서 “데이터 레이크는 여러 장점이 있지만, 데이터와 인공지능을 대규모로 활용할 수 있도록 하는 특성이 부족하다”라며, 관리 용이성 부족과 ACID(Atomic, Isolated, Consistent, Durable) 미준수, 트랜잭션 지원 등의 약점을 지적했다.

데이터 레이크 계층 위에 데이터브릭스의 오픈소스 델타 레이크(Delta Lake)와 같은 계층을 통합하면 기업은 다른 저장소로 데이터를 복제하지 않더라도 방대한 데이터를 머신러닝 애플리케이션에 활용할 수 있다.

두 번째 트렌드는 클라우드 마이그레이션을 통해 데이터 손실을 피하고 저장 능력을 확대하는 것이다. 시장 분석 기관 IDC와 가트너(Gartner)는 클라우드 비용 지출 비중이 전체 정보통신 시장의 10% 미만이지만, 다른 분야보다 급격한 성장세를 기록하는 추세이다.

클라우드 마이그레이션이 주목받는 이유는 다양하다. 우선 데이터를 온프레미스 환경에 저장하면 데이터 손실로 이어질 수 있다. 온프레미스 시스템은 백업 정책이 있더라도 백업이 전적으로 자동화된 완전 관리형 클라우드 환경보다 데이터 손실이 발생할 확률이 높다.

데이터를 클라우드로 이관하면 더욱 다양한 데이터 구조를 처리할 수 있을 뿐만 아니라 처리 속도도 높아진다. 또한, 클라우드 시스템은 무한한 용량에 가까운 데이터 저장이 가능해 온프레미스 방식에서 데이터 급증이 저장 능력 소실로 이어지는 것과 대비된다.

주요 클라우드 제공업체는 원활한 데이터 마이그레이션을 지원하는 다양한 서비스를 제공한다. 기업이 데이터를 서로 다른 제공업체의 저장소나 데이터베이스로 옮기는 과정을 돕는 전문 시스템 통합 업체도 다수 존재한다.

세 번째 트렌드는 기존 온프레미스 데이터와 새로운 클라우드 소비자 데이터를 통합하는 움직임이다. 데이터를 클라우드로 이관해야 하는 흐름을 견인한 부분적인 이유는 이미 클라우드에 저장한 데이터양이 많다는 점과 데이터가 클라우드에서 발생한다는 점이다.

소비자와 관련된 기업의 가장 중요한 데이터가 클라우드 데이터인 경우가 많아 기존의 온프레미스 데이터를 클라우드 환경으로 이전하는 데이터 마이그레이션이 트렌드로 떠올랐다. 다시 말해 사내 데이터 레이크와 데이터 레이크하우스를 클라우드로 전환하는 것이다. 기업은 이 과정에서 소비자 데이터에 대한 더욱 심층적이고 종합적인 분석이 가능해진다.

네 번째 트렌드는 비정형 데이터 처리에 최대한 활용하기 위해 데이터 마이그레이션을 이용하는 것이다. 위에서 언급한 소비자 관련 데이터의 상당 비중은 반정형 데이터 혹은 비정형 데이터이다. 대표적으로 지형 공간 데이터, 센서 및 소셜미디어 데이터 등이 속한다.

데이터는 관계형 데이터베이스로 관리하기 어려워서 비관계형 데이터베이스로 관리하는 사례가 증가하고 있다. 어느 데이터베이스를 이용하든 기업에서는 해당 데이터를 분석이 쉬운 형태로 전환할 수 있는 데이터 마이그레이션 기술을 찾고 있다.

마지막 다섯 번째 트렌드는 데이터 마이그레이션의 현대화 추세이다. 데이터 마이그레이션을 시작하는 기업은 사내에서 구축한 온프레미스 데이터베이스를 완전 관리형 데이터베이스로 옮기는 단계부터 시작한다. 일례로 자체 호스팅 MySQL 데이터베이스에서 아마존 RDS(Amazon Relational Database Service)로 변경할 수 있다.

본격적으로 마이그레이션을 실행하기 이전에 다른 데이터베이스를 이용하기로 한 시점에서 기업이 애플리케이션을 재설계하기로 하는 경우가 증가하고 있다. 다시 말해 데이터 마이그레이션은 데이터 저장, 관리, 인프라까지도 변환하는 작업을 동반한다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue