• 흐림동두천 1.0℃
  • 흐림강릉 1.3℃
  • 서울 3.2℃
  • 대전 3.3℃
  • 대구 6.8℃
  • 울산 6.6℃
  • 광주 8.3℃
  • 부산 7.7℃
  • 흐림고창 6.7℃
  • 흐림제주 10.7℃
  • 흐림강화 2.2℃
  • 흐림보은 3.2℃
  • 흐림금산 4.4℃
  • 흐림강진군 8.7℃
  • 흐림경주시 6.7℃
  • 흐림거제 8.0℃
기상청 제공

AI platform

"내 목소리 어때요?"...인간의 감정, 톤까지 살린 'AI 보이스'

네이버, 가상 인간 '로지'에 목소리 입혀 라디오 출연시켜

URL복사

[투데이e코노믹 = 이혜진 기자]  인공지능(AI)을 기반으로 한 음성통합기술이 인간의 목소리까지 만들어 내고 있다.

 

네이버는 싸이더스스튜디오 엑스와 함께 가상인간 로지에 목소리를 입혔다. 로지는 8일 SBS 파워FM '두시탈출 컬투쇼'에 게스트로 출연해 네이버가 만든 목소리로 인플루언서로서 활동에 관해 이야기하고 청취자 사연을 직접 읽기도 했다.

 

로지의 목소리는 네이버 클로바가 자체 개발한 NES(Natural End-to-end Speech Synthesis) 기술로 만들어졌다. NES는 실제 사람이 40분 정도 녹음하고 나면 분야에 대한 제약 없이 자연스러운 목소리를 만들어낼 수 있는 것이 특징이다.

 

가상인간 로지를 만든 싸이더스스튜디오엑스의 김진수 이사는 8일 본지와의 통화에서 “(로지가 목소리를 갖게) 됐다는 것을 알리려는 목적이 컸다“며 ”대사를 읽는 등 할 수 있는 게 많아졌기 때문에 로지의 활동 범위가 더 넓어질 것”이라고 말했다.

 

AI 보이스는 초거대 AI ‘하이퍼 클로바’를 출시한 네이버가 자부하는 핵심 서비스 중 하나다.

 

네이버클라우드는 지난달 서울 코엑스에서 열린 ‘제5회 국제인공지능대전(AI EXPO KOREA 2022)’에서 ‘하이퍼클로바(HyperCLOVA)’에 기반한 클라우드 서비스를 선보였는데 그 중 하나가 ‘클로바 더빙’이었다.

 

클로바 더빙은 2020년 2월 출시된 서비스로 6개 언어, 76가지 고품질 보이스를 토대로 동영상을 더빙할 수 있는 TTS(text-to-speech) 서비스다. 동영상 또는 PDF 파일 등에 사용자가 입력한 텍스트를 AI 보이스로 합성해 음원 또는 영상으로 제작, 다운로드 할 수 있다. 웃음, 환호 등 다양한 효과음을 내는 것도 가능하다.

 

익명을 요청한 네이버 관계자는 이날 본지와의 통화에서 “음성합성 기술을 네이버 지도 내비게이션, 파파고 번역기, 뉴스 본문 읽기 등 다양하게 적용하고 있고, 클로바 더빙을 통해서 사용자들이 다양한 콘텐츠를 쉽게 만들 수 있도록 돕고 있다”며 “음성합성 기술을 고도화하고, 자연스럽고 완성도 높은 합성기를 개발하는 데 주력하는 중”이라고 밝혔다.

 

쇼핑, 게임산업 등서 다양하게 활용

 

AI 보이스는 메타버스 등 가상공간이나 마케팅, 게임, 고객 응대 등 다양한 산업에서 각광받고 있다.

 

쇼핑 플랫폼 CJ온스타일은 AI 보이스와 AI 쇼호스트 개발에 심혈을 기울이고 있다. 방송 중 쇼호스트가 옷을 갈아입는 등의 공백시간을 메우는 데 활용하기 위해서다. 글자를 기계적으로 음성 변환하는 것이 아니라 인간처럼 감정과 목소리 톤까지 살려 생동감을 더해줄 예정이다.

 

AI 기반 음성 제작기업인 ‘로보AI(LOVO AI)’는 지난 1월 게임 ‘오버워치’ 캐릭터 ‘루시우’ 목소리의 주인공 성우 조니 크루즈와 ‘D.Va’를 연기한 미국인 성우 샬렛 청의 음성 파일 100개를 가지고, 8888개의 인공음성 대체 불가능 토큰(NFT)를 만들었다. 이 토큰은 10분 만에 완판됐다.