코딩

네이버의 새로운 개발자 도구 ‘음성합성 API’

네이버는 지난해부터 인링크(in-link) 기사에 음성합성(tts) 기능을 서비스하고 있다. 이 기능은 텍스트를 음성 형태의 음원으로 변환해 사용자들이 기사를 읽지 않고도 스피커나 이어폰을 통해 들을 수 있도록 제공한다. 지하철이나 버스에서 스크롤 없이 기사를 접할 수 있다는 점에서 사용자 편의성이 극대화됐다. 이 서비스는 네이버 개발자 센터를 통해서 개발자들이 이용할 수 있게 공개돼 있다. 한글 뿐 아니라 영어, 중국어, 일본어 등 사용빈도가 많은 언어를 중심으로 서비스가 돼 있어 확장성이 높다.

네이버 음성합성 기능을 이용하기 위해서는 우선 애플리케이션 등록(API  이용신청)을 하고 client id와 client secret 값을 부여받아야 한다.

%ec%9d%8c%ec%84%b1%ed%95%a9%ec%84%b11

client id와 secret 값을 발급 받기 위해서는 네이버에 가입돼 있어야 한다. 특별한 자격기준은 없다. 네이버에 로그인을 하고 개발자센터로 접속한다. 음성합성 API를 클릭하고 오픈 API 이용신청을 클릭한다.

%ec%9d%8c%ec%84%b1%ed%95%a9%ec%84%b12

신청을 위해서는 몇 가지 기본정보를 입력해야 한다. 음성합성 기능을 활용할 애플리케이션 이름과 제공할 서비스의 카테고리를 선택한다. 꼭 정확하게 쓸 필요는 없다. 그 다음 이용목적을 선택해야 한다. <로그인 오픈 API>와 <비로그인 오픈 API>가 있다. 접속 토큰의 사용 유무가 핵심인데 보통 비로그인 오픈 API를 선택한다. 이 경우에는 자신의 사용환경 주소를 요구한다. 자신이 소유하고 있는 사이트의 URL, 혹은 패키지 명을 입력하면 된다. 그리고 오픈 API 이용권한 신청에서 음성합성을 클릭하면 기본 정보 입력이 끝난다.

 

%ec%9d%8c%ec%84%b1%ed%95%a9%ec%84%b13

정보입력이 끝나면 client id와 client secret  값이 부여된다. 사용방법은 기존 API 사용법과 같다. 음성합성 API는 3개의 요청변수를 갖는다. speaker, speed, text다. 이 중 speed만 -5 ~ 5 사이의 integer(정수) 값만 받고, 나머지 speaker와 text는 string(문자) 값을 받는다.

%ec%9d%8c%ec%84%b1%ed%95%a9%ec%84%b14

아웃풋은 mp3 파일 형태로 다운로드돼 어느 기기에서도 플레이가 가능하다. 호환성이 좋다는 의미다. 또한 미디어 스타트업을 준비하는 개발자 입장에서는 활용도가 높은 서비스다. 현재 베타버전으로 일일 허용한도는 클라이언트당 1만개다.

되고 싶은 것보다 하고 싶은게 많아요. 어느 순간 둘 중 하나를 선택해야 한다면 하고 싶을 걸 택할 겁니다. 삶은 짧고, 불확실하니까.