CWN(CHANGE WITH NEWS) - 인공지능 로봇, 인간의 목소리를 따라한다?

  • 구름많음제주6.4℃
  • 맑음북춘천-6.0℃
  • 구름많음장흥-2.4℃
  • 맑음고흥0.0℃
  • 구름조금청주-2.9℃
  • 맑음완도3.2℃
  • 맑음서산-4.8℃
  • 맑음부산0.5℃
  • 구름조금서귀포5.3℃
  • 맑음백령도-3.6℃
  • 맑음여수0.8℃
  • 맑음양산시0.8℃
  • 구름많음성산4.9℃
  • 맑음천안-3.9℃
  • 맑음이천-4.9℃
  • 흐림정선군-4.7℃
  • 흐림추풍령-2.3℃
  • 구름조금대구-4.3℃
  • 흐림고산6.3℃
  • 구름조금순창군-2.4℃
  • 맑음홍성-4.4℃
  • 눈전주-0.9℃
  • 흐림임실-2.7℃
  • 맑음산청1.0℃
  • 맑음남해2.0℃
  • 맑음북창원-0.2℃
  • 맑음밀양-6.5℃
  • 구름조금충주-3.5℃
  • 맑음합천-4.3℃
  • 구름많음부여-2.0℃
  • 구름많음영덕-1.0℃
  • 구름조금태백-6.3℃
  • 구름많음강진군2.5℃
  • 눈대전-1.8℃
  • 눈안동-5.1℃
  • 맑음속초-2.4℃
  • 흐림장수-2.2℃
  • 맑음제천-4.1℃
  • 맑음서울-6.2℃
  • 구름많음해남1.9℃
  • 구름많음흑산도3.1℃
  • 구름많음봉화-3.6℃
  • 흐림영월-5.8℃
  • 구름많음거창0.1℃
  • 맑음광양시-0.2℃
  • 구름조금순천-0.9℃
  • 흐림세종-2.9℃
  • 맑음수원-6.4℃
  • 흐림문경-1.8℃
  • 구름조금군산-1.4℃
  • 구름많음영주-2.1℃
  • 맑음대관령-9.0℃
  • 구름많음남원-3.1℃
  • 구름조금영천-3.1℃
  • 맑음강화-7.0℃
  • 흐림상주-1.5℃
  • 맑음통영1.8℃
  • 구름조금목포2.4℃
  • 흐림고창군-2.8℃
  • 안개광주-1.1℃
  • 맑음진주-5.7℃
  • 맑음파주-9.9℃
  • 맑음김해시-0.6℃
  • 구름많음고창-1.2℃
  • 맑음동두천-7.4℃
  • 흐림구미-0.2℃
  • 맑음양평-5.1℃
  • 맑음울산-3.9℃
  • 맑음인천-6.4℃
  • 맑음북부산-4.2℃
  • 흐림정읍-0.6℃
  • 흐림원주-3.6℃
  • 맑음철원-10.8℃
  • 맑음춘천-6.9℃
  • 맑음보성군-0.5℃
  • 구름많음영광군1.8℃
  • 맑음거제1.9℃
  • 구름많음서청주-3.4℃
  • 맑음홍천-5.5℃
  • 맑음경주시-7.9℃
  • 구름조금포항-1.5℃
  • 맑음북강릉-4.5℃
  • 맑음창원-1.0℃
  • 맑음동해-1.0℃
  • 구름조금보령-3.0℃
  • 맑음의령군-6.8℃
  • 흐림금산-1.0℃
  • 눈울릉도0.0℃
  • 구름많음함양군0.6℃
  • 흐림부안0.6℃
  • 맑음인제-5.9℃
  • 구름많음진도군3.6℃
  • 흐림보은-1.7℃
  • 흐림의성-7.1℃
  • 구름조금울진-2.0℃
  • 구름많음청송군-3.5℃
  • 맑음강릉-1.3℃
  • 2026.01.24 (토)

인공지능 로봇, 인간의 목소리를 따라한다?

이서하 / 기사승인 : 2021-02-11 15:30:08
  • -
  • +
  • 인쇄

보통 우리가 알고 있는 인공지능(AI) 로봇의 목소리는 인간의 목소리보다 단조롭고 딱딱한 느낌이다. 그러나 최근에는 인간의 목소리의 높낮이, 호흡, 바이브레이션까지 따라 하는 기술이 개발되고 있다.

TTS(Text To Speech)라고 불리는 기술은 말소리의 음파를 기계가 자동으로 만들어 내는 기술이다. 모델로 선정된 한 사람의 말소리를 녹음해, 일정한 음성 단위로 나눈다. 그 다음, 부호를 붙여 합성기에 입력한 뒤, 지시에 따라 필요한 음성 단위만을 다시 합쳐 말소리를 인위로 만들어내는 기술이다. 시리나 구글 어시스턴트와 같은 음성 비서, 차량용 내비게이션 음성 안내 등 다양한 서비스에 TTS 서비스가 적용되었다.

그렇다면, AI가 노래하는 데 필요한 기술은 무엇일까? 가창음성합성(SVS)시스템이라는 연구용 AI가 가사와 음의 높낮이를 입력받고 제공된 가수의 목소리를 합쳐서 학습하면 진짜 가수의 모창 가수가 되어 노래한다.

AI는 유명한 가수뿐만 아니라 일반인의 목소리도 따라 할 수 있다. AI에 목소리 데이터를 제공하면 스스로 딥러닝을 통해 수천 번, 수백만 번 학습하게 된다.

AI는 딥러닝 덕분에 인간 목소리의 톤의 높낮이, 음성의 길이, 그리고 음의 세기 등을 따라 하게 되는 것이다. AI가 노래를 부르게 하고 싶다면 발음 데이터와 멜로디 데이터를 따로 학습한 후에 합쳐서 출력하게끔 프로그래밍하면 된다.

현재, 음성 합성 기술은 AI 스피커, 전화상담, 키오스크, ATM, 안내방송, 그리고 E-Book과 오디오북에서 활용된다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue