CWN(CHANGE WITH NEWS) - 자율주행 기술 알고리즘 훈련, ′합성 데이터′로 완료한다?

  • 흐림보령18.5℃
  • 흐림김해시18.3℃
  • 구름많음고산22.0℃
  • 흐림남해19.0℃
  • 흐림안동15.2℃
  • 흐림대전16.9℃
  • 흐림거창14.5℃
  • 흐림원주16.0℃
  • 흐림고창군17.8℃
  • 흐림북창원18.6℃
  • 흐림광양시18.3℃
  • 흐림동해18.1℃
  • 흐림고창17.2℃
  • 흐림서귀포22.1℃
  • 흐림밀양16.9℃
  • 흐림거제17.9℃
  • 흐림완도18.7℃
  • 박무청주18.8℃
  • 흐림남원16.0℃
  • 구름많음춘천16.4℃
  • 흐림경주시15.2℃
  • 흐림부여16.2℃
  • 흐림태백11.9℃
  • 박무인천18.0℃
  • 흐림산청15.6℃
  • 흐림임실15.4℃
  • 흐림영주14.3℃
  • 흐림파주15.6℃
  • 흐림문경15.5℃
  • 흐림통영18.9℃
  • 구름조금속초18.8℃
  • 흐림군산17.5℃
  • 흐림흑산도20.6℃
  • 박무서울17.4℃
  • 흐림정읍17.5℃
  • 흐림강화15.1℃
  • 흐림해남16.9℃
  • 구름많음대관령11.6℃
  • 흐림여수20.0℃
  • 흐림순천14.8℃
  • 흐림광주18.4℃
  • 흐림구미16.4℃
  • 흐림울진16.7℃
  • 흐림포항18.6℃
  • 흐림고흥16.8℃
  • 흐림충주15.8℃
  • 흐림전주18.1℃
  • 박무북춘천16.2℃
  • 구름많음부산21.3℃
  • 흐림세종16.3℃
  • 흐림영광군17.5℃
  • 흐림보성군17.2℃
  • 흐림강진군17.4℃
  • 흐림영천14.9℃
  • 흐림청송군13.6℃
  • 흐림대구17.1℃
  • 흐림부안18.1℃
  • 흐림영월15.3℃
  • 흐림제천13.9℃
  • 흐림홍천16.1℃
  • 흐림금산15.0℃
  • 흐림수원16.3℃
  • 흐림백령도19.0℃
  • 흐림순창군16.2℃
  • 흐림합천16.1℃
  • 흐림진주15.4℃
  • 흐림영덕18.5℃
  • 흐림천안16.2℃
  • 구름조금북강릉17.8℃
  • 흐림의성15.1℃
  • 흐림진도군17.6℃
  • 흐림의령군14.4℃
  • 흐림추풍령14.3℃
  • 흐림상주15.8℃
  • 구름많음인제15.4℃
  • 흐림목포19.5℃
  • 흐림서산17.2℃
  • 흐림봉화12.8℃
  • 구름많음성산19.4℃
  • 흐림이천15.8℃
  • 흐림양평16.1℃
  • 구름많음강릉19.4℃
  • 구름조금울릉도20.3℃
  • 구름많음북부산17.2℃
  • 흐림서청주16.1℃
  • 구름많음울산16.8℃
  • 구름많음철원14.9℃
  • 흐림창원19.2℃
  • 구름많음양산시17.9℃
  • 흐림장흥16.7℃
  • 구름많음제주20.1℃
  • 흐림동두천15.4℃
  • 흐림함양군15.3℃
  • 흐림정선군13.8℃
  • 흐림장수13.7℃
  • 흐림보은15.0℃
  • 박무홍성16.9℃
  • 2025.10.02 (목)

자율주행 기술 알고리즘 훈련, '합성 데이터'로 완료한다?

박채원 / 기사승인 : 2022-06-20 13:39:54
  • -
  • +
  • 인쇄

알고리즘 훈련은 자율주행 기술의 안전 주행 능력을 최대화하기 위한 필수 조건 중 하나이다. 실제 주행 현장에 나서기 전 주행 현장에서 직면한 여러 상황을 담은 데이터를 활용해 적절한 대처 방법을 완벽히 학습하여야 한다. 그런데 실제 주행 데이터 대신 다른 데이터를 이용한다면 어떨까?

영국 일간지 가디언이 합성 데이터를 이용해 차량 알고리즘을 훈련하는 스타트업이 증가하는 추세라고 보도했다. 모두 운전자가 졸음을 느끼는 상황을 감지하는 데 활용할 가짜 인간 아바타를 대거 생성하는 등 이른바 가짜 데이터로 차량의 인공지능(AI) 시스템을 훈련한다.

그 대표적인 기업인 신테티스 AI(Synthesis AI)와 데이터젠(Datagen) 모두 합성 데이터 생성 과정에 상세한 얼굴 스캔 결과와 센서로 포착한 움직임 데이터 등 전신 3D 스캔 이미지를 활용한다. 이후 여러 각도에서 변경하여 인간 아바타의 3D 이미지 수백만 개를 생성한다. 데이터는 시뮬레이션 상황에 따라 여러 가지 행동을 보여주는 비디오 게임의 캐릭터와 같은 모습을 구현한다.

만약, 운전자가 졸음을 느끼는 상황을 감지하는 데 활용할 합성 데이터를 생성하고자 한다면, 모션 캡처와 3D 애니메이션, 그 외 비디오 게임 및 애니메이션 영상 제작 기술로 졸음을 느끼는 운전자 아바타를 제작해, 졸음운전 예방에 적합한 데이터를 완성한다.

합성 데이터 사용 시 기존 딥러닝 알고리즘의 복잡한 문제를 다수 줄일 수 있다. 일반적으로 기업은 자율주행 기술 알고리즘을 훈련할 때, 다량의 현실 세계 데이터를 처리한다. 이때, 영상은 AI가 자동 분류하지 않는다. 저임금 노동자가 모든 영상을 하나씩 확인하고 주어진 조건에 따라 분류한다.

반면, 합성 데이터는 훈련 데이터 처리 및 분류 과정에 소요되는 시간과 비용을 줄일 수 있다. 게다가 현실 세계의 데이터가 유색인종 등 특정 인구 집단의 행동과 얼굴 인식 능력이 현저히 낮다고 입증된 사실을 고려하면, 합성 데이터는 AI 개발 과정의 오래된 골칫거리인 편견 문제 제거에 도움이 될 수 있다.

그동안 AI의 차별 및 편견 문제가 끊임없이 제기된 주된 이유 중 하나는 소수 민족 집단의 데이터가 현저히 적었기 때문이다. 이에, 데이터젠 등 합성 데이터 제작 기업은 그동안 소외된 집단의 특성을 담은 캐릭터로 합성 데이터를 생성한다. 즉, 소수 민족 등 소외 집단의 데이터와 나머지 집단의 데이터 격차를 줄이면서 정보 인식률 차이를 좁힐 수 있을 것으로 기대된다.

하지만 자동차 업계에서는 합성 데이터를 자율주행 기술의 정확도와 안전 향상에 활용하는 것이 가장 중요하다. 기존 접근 방식은 운전 영상을 오랜 시간 촬영하고 딥러닝에 주입한다. 변수가 없는 일반적인 상황에서 제법 원활한 도로 주행이 가능한 차량을 제작하는 데는 큰 문제가 없었다.

그러나 자동차 업계가 오랫동안 어려움을 겪은 부분은 수백만 시간 분량의 데이터에서도 찾아보기 어려운 예상치 못한 변수 대응 능력이다. 주행 중인 차량 앞으로 갑자기 사람이나 애완동물이 달려들 때나 반대편 차량이 운전자를 향해 달려와 충돌 위험성이 발생할 확률이 높은 상황 등을 언급할 수 있다.

합성 데이터는 예상하지 못한 상황을 제한 없이 생성할 수 있다. 웨이모는 지난해 미국 온라인 테크 매체 더버지와의 인터뷰에서 현실 세계 주행 데이터는 단 2,000만 마일 보유했으나 총 150억 마일 거리의 가상 시뮬레이션 기반 주행 데이터를 생성했다.

이 때문에 실제로 웨이모(Waymo), 크루즈(Cruise), 웨이브(Wayve) 등 자율주행 차량 개발사가 자율주행 기술 훈련을 위해 현실 세계의 데이터뿐만 아니라 가상 세계의 시뮬레이션을 담은 데이터에도 의존하는 추세이다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue