코딩

네이버의 새로운 개발자 도구 ‘음성합성 API’

네이버는 지난해부터 인링크(in-link) 기사에 음성합성(tts) 기능을 서비스하고 있다. 이 기능은 텍스트를 음성 형태의 음원으로 변환해 사용자들이 기사를 읽지 않고도 스피커나 이어폰을 통해 들을 수 있도록 제공한다. 지하철이나 버스에서 스크롤 없이 기사를 접할 수 있다는 점에서 사용자 편의성이 극대화됐다. 이 서비스는 네이버 개발자 센터를 통해서 개발자들이 이용할 수 있게 공개돼 있다. 한글 뿐 아니라 영어, 중국어, 일본어 등 사용빈도가 많은 언어를 중심으로 서비스가 돼 있어 확장성이 높다.

네이버 음성합성 기능을 이용하기 위해서는 우선 애플리케이션 등록(API  이용신청)을 하고 client id와 client secret 값을 부여받아야 한다.

%ec%9d%8c%ec%84%b1%ed%95%a9%ec%84%b11

client id와 secret 값을 발급 받기 위해서는 네이버에 가입돼 있어야 한다. 특별한 자격기준은 없다. 네이버에 로그인을 하고 개발자센터로 접속한다. 음성합성 API를 클릭하고 오픈 API 이용신청을 클릭한다.

%ec%9d%8c%ec%84%b1%ed%95%a9%ec%84%b12

신청을 위해서는 몇 가지 기본정보를 입력해야 한다. 음성합성 기능을 활용할 애플리케이션 이름과 제공할 서비스의 카테고리를 선택한다. 꼭 정확하게 쓸 필요는 없다. 그 다음 이용목적을 선택해야 한다. <로그인 오픈 API>와 <비로그인 오픈 API>가 있다. 접속 토큰의 사용 유무가 핵심인데 보통 비로그인 오픈 API를 선택한다. 이 경우에는 자신의 사용환경 주소를 요구한다. 자신이 소유하고 있는 사이트의 URL, 혹은 패키지 명을 입력하면 된다. 그리고 오픈 API 이용권한 신청에서 음성합성을 클릭하면 기본 정보 입력이 끝난다.

 

%ec%9d%8c%ec%84%b1%ed%95%a9%ec%84%b13

정보입력이 끝나면 client id와 client secret  값이 부여된다. 사용방법은 기존 API 사용법과 같다. 음성합성 API는 3개의 요청변수를 갖는다. speaker, speed, text다. 이 중 speed만 -5 ~ 5 사이의 integer(정수) 값만 받고, 나머지 speaker와 text는 string(문자) 값을 받는다.

%ec%9d%8c%ec%84%b1%ed%95%a9%ec%84%b14

아웃풋은 mp3 파일 형태로 다운로드돼 어느 기기에서도 플레이가 가능하다. 호환성이 좋다는 의미다. 또한 미디어 스타트업을 준비하는 개발자 입장에서는 활용도가 높은 서비스다. 현재 베타버전으로 일일 허용한도는 클라이언트당 1만개다.


Warning: printf(): Too few arguments in /home/lightover/html/wp-content/themes/fortunato-pro/inc/template-tags.php on line 46
되고 싶은 것보다 하고 싶은게 많아요. 어느 순간 둘 중 하나를 선택해야 한다면 하고 싶을 걸 택할 겁니다. 삶은 짧고, 불확실하니까.