CWN(CHANGE WITH NEWS) - 인공지능 로봇, 인간의 목소리를 따라한다?

  • 맑음북강릉9.4℃
  • 맑음천안6.2℃
  • 구름많음해남13.0℃
  • 구름많음강진군12.6℃
  • 맑음성산14.5℃
  • 맑음목포12.7℃
  • 맑음강화9.8℃
  • 맑음양평7.8℃
  • 맑음울산10.8℃
  • 맑음정읍10.0℃
  • 맑음청송군3.3℃
  • 맑음홍성6.8℃
  • 맑음동해10.7℃
  • 맑음보령7.6℃
  • 맑음구미10.0℃
  • 맑음서귀포15.3℃
  • 맑음대전8.4℃
  • 맑음김해시10.3℃
  • 맑음부여5.5℃
  • 맑음의성4.8℃
  • 구름조금남원9.2℃
  • 구름조금진도군13.1℃
  • 맑음서청주5.1℃
  • 맑음대관령1.0℃
  • 맑음이천8.3℃
  • 맑음부안9.6℃
  • 맑음의령군4.3℃
  • 구름많음완도12.9℃
  • 맑음충주4.6℃
  • 맑음거제8.4℃
  • 구름많음거창6.5℃
  • 구름많음고흥11.5℃
  • 구름많음함양군7.7℃
  • 맑음고창8.1℃
  • 구름조금포항12.4℃
  • 맑음영광군10.0℃
  • 맑음수원7.5℃
  • 구름많음합천7.4℃
  • 맑음안동5.2℃
  • 구름조금추풍령9.0℃
  • 맑음군산8.7℃
  • 맑음북춘천3.9℃
  • 맑음울릉도12.5℃
  • 맑음봉화2.5℃
  • 맑음고산16.0℃
  • 맑음강릉11.9℃
  • 구름조금전주10.9℃
  • 맑음세종7.7℃
  • 구름조금보성군11.7℃
  • 구름조금금산5.9℃
  • 맑음서산5.4℃
  • 맑음상주8.8℃
  • 맑음영주5.7℃
  • 맑음진주5.0℃
  • 맑음청주10.3℃
  • 맑음광양시12.0℃
  • 맑음인천9.4℃
  • 맑음장수4.0℃
  • 맑음백령도12.1℃
  • 구름많음영천7.6℃
  • 맑음남해10.5℃
  • 맑음흑산도12.7℃
  • 맑음제천2.2℃
  • 맑음영월4.4℃
  • 맑음제주15.6℃
  • 맑음고창군7.5℃
  • 맑음순천11.3℃
  • 맑음창원12.0℃
  • 맑음춘천4.3℃
  • 맑음부산13.5℃
  • 맑음서울9.9℃
  • 맑음울진8.7℃
  • 구름조금경주시7.4℃
  • 맑음속초11.4℃
  • 맑음파주5.1℃
  • 맑음양산시8.4℃
  • 맑음보은6.0℃
  • 맑음순창군9.4℃
  • 구름많음산청8.4℃
  • 구름많음장흥11.8℃
  • 맑음문경8.1℃
  • 맑음여수13.6℃
  • 맑음북창원10.3℃
  • 맑음인제4.8℃
  • 맑음원주5.4℃
  • 구름많음밀양8.1℃
  • 맑음정선군2.5℃
  • 맑음통영10.0℃
  • 맑음북부산7.2℃
  • 구름조금대구10.6℃
  • 맑음광주11.1℃
  • 맑음태백2.9℃
  • 맑음영덕11.0℃
  • 맑음철원3.5℃
  • 맑음임실7.6℃
  • 맑음동두천7.5℃
  • 맑음홍천5.4℃
  • 2025.11.13 (목)

인공지능 로봇, 인간의 목소리를 따라한다?

이서하 / 기사승인 : 2021-02-11 15:30:08
  • -
  • +
  • 인쇄

보통 우리가 알고 있는 인공지능(AI) 로봇의 목소리는 인간의 목소리보다 단조롭고 딱딱한 느낌이다. 그러나 최근에는 인간의 목소리의 높낮이, 호흡, 바이브레이션까지 따라 하는 기술이 개발되고 있다.

TTS(Text To Speech)라고 불리는 기술은 말소리의 음파를 기계가 자동으로 만들어 내는 기술이다. 모델로 선정된 한 사람의 말소리를 녹음해, 일정한 음성 단위로 나눈다. 그 다음, 부호를 붙여 합성기에 입력한 뒤, 지시에 따라 필요한 음성 단위만을 다시 합쳐 말소리를 인위로 만들어내는 기술이다. 시리나 구글 어시스턴트와 같은 음성 비서, 차량용 내비게이션 음성 안내 등 다양한 서비스에 TTS 서비스가 적용되었다.

그렇다면, AI가 노래하는 데 필요한 기술은 무엇일까? 가창음성합성(SVS)시스템이라는 연구용 AI가 가사와 음의 높낮이를 입력받고 제공된 가수의 목소리를 합쳐서 학습하면 진짜 가수의 모창 가수가 되어 노래한다.

AI는 유명한 가수뿐만 아니라 일반인의 목소리도 따라 할 수 있다. AI에 목소리 데이터를 제공하면 스스로 딥러닝을 통해 수천 번, 수백만 번 학습하게 된다.

AI는 딥러닝 덕분에 인간 목소리의 톤의 높낮이, 음성의 길이, 그리고 음의 세기 등을 따라 하게 되는 것이다. AI가 노래를 부르게 하고 싶다면 발음 데이터와 멜로디 데이터를 따로 학습한 후에 합쳐서 출력하게끔 프로그래밍하면 된다.

현재, 음성 합성 기술은 AI 스피커, 전화상담, 키오스크, ATM, 안내방송, 그리고 E-Book과 오디오북에서 활용된다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue