CWN(CHANGE WITH NEWS) - 인공지능 로봇, 인간의 목소리를 따라한다?

  • 맑음창원-0.6℃
  • 맑음양산시1.3℃
  • 흐림장수-1.6℃
  • 맑음파주-7.9℃
  • 맑음순천-1.2℃
  • 흐림서청주-2.3℃
  • 흐림금산-0.3℃
  • 맑음동두천-6.7℃
  • 구름많음청송군-3.0℃
  • 맑음속초-1.9℃
  • 맑음북강릉-4.7℃
  • 맑음산청0.5℃
  • 맑음영천-5.2℃
  • 맑음양평-4.9℃
  • 맑음통영1.3℃
  • 흐림원주-3.8℃
  • 맑음서산-3.6℃
  • 눈안동-6.0℃
  • 맑음남해1.7℃
  • 구름많음흑산도3.3℃
  • 구름많음정읍-1.3℃
  • 눈전주-0.6℃
  • 구름많음영광군1.6℃
  • 맑음임실-3.9℃
  • 흐림상주-2.0℃
  • 구름많음고창군-3.2℃
  • 흐림고산6.3℃
  • 맑음북부산-4.9℃
  • 맑음장흥-3.6℃
  • 구름많음고창-2.7℃
  • 흐림충주-3.5℃
  • 구름많음함양군0.8℃
  • 흐림부여-3.6℃
  • 흐림문경-1.9℃
  • 맑음울산-3.5℃
  • 흐림군산-0.4℃
  • 흐림부안1.4℃
  • 박무북춘천-5.4℃
  • 맑음북창원-0.5℃
  • 구름많음천안-2.1℃
  • 구름많음의성-8.3℃
  • 흐림정선군-4.6℃
  • 흐림보은-2.3℃
  • 흐림세종-2.5℃
  • 맑음수원-5.1℃
  • 구름조금동해-1.0℃
  • 맑음진주-5.4℃
  • 흐림인제-6.1℃
  • 구름많음완도3.2℃
  • 맑음여수1.0℃
  • 구름조금강릉-1.0℃
  • 맑음경주시-7.2℃
  • 맑음포항-1.2℃
  • 구름많음서귀포5.3℃
  • 구름조금영덕-0.8℃
  • 구름조금홍성-2.2℃
  • 구름조금강진군2.1℃
  • 맑음밀양-6.1℃
  • 맑음강화-6.2℃
  • 구름조금울진-2.1℃
  • 맑음의령군-5.0℃
  • 눈청주-2.3℃
  • 구름많음서울-5.3℃
  • 맑음부산0.8℃
  • 흐림영주-2.2℃
  • 맑음고흥-0.2℃
  • 맑음대구-4.0℃
  • 맑음광양시-0.5℃
  • 흐림제천-3.6℃
  • 흐림영월-5.2℃
  • 맑음홍천-6.1℃
  • 구름많음태백-5.8℃
  • 구름많음거창-0.3℃
  • 눈대전-1.6℃
  • 맑음합천-4.2℃
  • 구름많음목포2.9℃
  • 눈울릉도0.0℃
  • 맑음춘천-6.0℃
  • 구름많음순창군-2.1℃
  • 구름많음진도군3.7℃
  • 비제주6.5℃
  • 안개광주-0.8℃
  • 구름많음해남-0.3℃
  • 맑음구미-5.7℃
  • 맑음백령도-3.1℃
  • 맑음거제1.9℃
  • 구름많음봉화-4.3℃
  • 흐림추풍령-1.4℃
  • 구름많음보령-0.6℃
  • 맑음이천-3.3℃
  • 구름많음성산4.0℃
  • 맑음철원-9.8℃
  • 맑음보성군-2.0℃
  • 맑음인천-6.0℃
  • 맑음김해시-0.7℃
  • 구름많음남원-3.2℃
  • 구름많음대관령-8.2℃
  • 2026.01.24 (토)

인공지능 로봇, 인간의 목소리를 따라한다?

이서하 / 기사승인 : 2021-02-11 15:30:08
  • -
  • +
  • 인쇄

보통 우리가 알고 있는 인공지능(AI) 로봇의 목소리는 인간의 목소리보다 단조롭고 딱딱한 느낌이다. 그러나 최근에는 인간의 목소리의 높낮이, 호흡, 바이브레이션까지 따라 하는 기술이 개발되고 있다.

TTS(Text To Speech)라고 불리는 기술은 말소리의 음파를 기계가 자동으로 만들어 내는 기술이다. 모델로 선정된 한 사람의 말소리를 녹음해, 일정한 음성 단위로 나눈다. 그 다음, 부호를 붙여 합성기에 입력한 뒤, 지시에 따라 필요한 음성 단위만을 다시 합쳐 말소리를 인위로 만들어내는 기술이다. 시리나 구글 어시스턴트와 같은 음성 비서, 차량용 내비게이션 음성 안내 등 다양한 서비스에 TTS 서비스가 적용되었다.

그렇다면, AI가 노래하는 데 필요한 기술은 무엇일까? 가창음성합성(SVS)시스템이라는 연구용 AI가 가사와 음의 높낮이를 입력받고 제공된 가수의 목소리를 합쳐서 학습하면 진짜 가수의 모창 가수가 되어 노래한다.

AI는 유명한 가수뿐만 아니라 일반인의 목소리도 따라 할 수 있다. AI에 목소리 데이터를 제공하면 스스로 딥러닝을 통해 수천 번, 수백만 번 학습하게 된다.

AI는 딥러닝 덕분에 인간 목소리의 톤의 높낮이, 음성의 길이, 그리고 음의 세기 등을 따라 하게 되는 것이다. AI가 노래를 부르게 하고 싶다면 발음 데이터와 멜로디 데이터를 따로 학습한 후에 합쳐서 출력하게끔 프로그래밍하면 된다.

현재, 음성 합성 기술은 AI 스피커, 전화상담, 키오스크, ATM, 안내방송, 그리고 E-Book과 오디오북에서 활용된다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue