네이버, 짧은 이야기만으로 비슷한 목소리 만드는 음성 합성 기술 공개

기자정보, 기사등록일
윤경진 기자
입력 2019-11-14 13:27
    도구모음
  • 글자크기 설정
  • 40분의 음성 데이터로 자연스러운 합성음을 쉽고 빠르게 제작… 기쁨·슬픔 등 감정도 반영

네이버는 짧은 녹음만으로 고품질의 합성음을 제작할 수 있는 클로바의 음성 합성 신기술 ‘NES(Natural End–to-end Speech Synthesis)’을 공개하고, 이를 기반으로 보이스 비즈니스 서비스를 제공한다고 14일 밝혔다.
 

네이버 클로바 CI[사진=네이버]

NES는 40분 수준의 음성 데이터(약 400문장)로 실제 사람의 음성에 가까운 자연스러운 합성음을 제작할 수 있는 기술이다. 40시간에서 100시간 정도의 음성이 필요했던 기존과 비교해 쉽고 빠르게 음성 서비스를 개발할 수 있다는 것이 장점이다. 특정 분야에 대한 제약 없이 사용할 수 있으며, 기본 목소리 외에 기쁨·슬픔 등 감정이 반영된 목소리도 제공한다. 현재 클로바 보이스 홈페이지에서 무료로 ‘NES’ 기술로 제작한 음성합성을 체험해볼 수 있다.

네이버는 기업 이용자를 대상으로, ‘NES’ 기반의 보이스 비즈니스 서비스인 ‘클로바 프리미엄 보이스(CPV)’도 판매하고 있다. 기업 광고, 고객 응대, 오디오 콘텐츠 등 고품질의 합성음이 필요한 다양한 서비스에 활용할 수 있으며, 네이버 클라우드 플랫폼에서 유료 API 형태로 제공된다.

김재민 네이버 클로바 보이스 책임리더는 "NES 기술로 향후에는 누구나 쉽고 편리하게 나만의 ‘보이스 폰트’를 제작할 수 있을 것으로 기대한다"며 "기본 감정 외에도 엄격한 뉴스 앵커 목소리, 부드러운 친구 목소리 등 다양한 감정과 스타일의 합성기를 확대해나갈 것"이라고 말했다.

한편, 네이버는 클로바 스마트 스피커, 네이버 뉴스, 네이버 지도, 파파고, 오디오클립 등 다양한 서비스에 클로바의 음성합성 기술을 활용하고 있다. 연내에는 NES 기술을 활용한 신규 AI 서비스도 출시할 계획이다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
실시간 인기
기사 이미지 확대 보기
닫기