AI 음성인식 솔루션 Provider Research - Naver
1. 회사/브랜드
네이버, CLOVA
2. 사이트
https://developers.naver.com/docs/clova/client/
https://www.ncloud.com/product/aiService/csr
3. 검토 대상 서비스
1) CLOVA Interface Connect(CIC)
-> 제휴제안 및 3rd 솔루션(SoM) 적용
2) Naver Cloud platform SaaS 적용
-> TTS, STT, Chatbot 등
4. 적용사례
LG 클로이 시리즈
유비텍(교육용로봇, 미니로봇)
5. 세부 내용
인공 지능 서비스를 개발 또는 제공하려는 PC 및 모바일용 애플리케이션, 그리고
모바일 또는 가정용 디바이스에 클라이언트 CLOVA와 연동할 수 있는 interface를 제공하는 네이버 플랫폼.
CIC가 제공하는 API를 통해 사용자의 요청을 CLOVA로 전달하며 CLOVA의 응답을 CIC를 통해 클라이언트에 제공.
로봇에는 음성합성(TTS), 음성인식(STT), 안면 얼굴인식 등의 기술이 적용되어 있고,
각 기술에 해당하는 상품 구성은 아래와 같습니다.
1. 음성인식(STT)
- CLOVA Speech : 음성메모, 영상 자막 생성, 통화 녹취 등 길이가 길고 복잡한 문장을 읽는 음성인식을 위한 서비스.
- CLOVA Speech Recognition(CSR) : 배달 주문, 금융 서비스, 가전제품 동작, 홈 네트워크 제어 등 버튼으로 조작해야 했던 서비스를 음성으로 컨트롤하는 경우에 자주 사용되는 서비스.
2. 음성합성(TTS)
- CLOVA Voice : 총 80가지 자연스러운 음성 합성음을 제공하는 고품질 음성 합성 서비스.
3. 안면인식
- CLOVA Face Recognition(CFR) : 얼굴과 관련된 다양한 정보를 제공하는 얼굴 감지 및 인식 API
디바이스에서 대화를 목적으로 CLOVA Studio를 사용하는 것은 현재 추천하고 있지 않습니다.
기존의 CLOVA Chatbot 상품 활용을 권해드립니다.
6. 요구사항
- SoM Hardware 적용시
CPU: Coretex-A7(1G 이상) Dual or Quad
Memory: 512G 이상
Flash: 4G 이상
Bluetooth: 4.2
WiFi: 2.4G or 5G(or Both)
마이크, 스피커 필수
Keyword Spotting: Conexant/Sensory 를 추천함 (디바이스 업체에서 별도 라이센스 필요)
- 솔루션 제공사 (마크티)
7. 요금
1) 음성 재생(긴문장) CLOVA Speech 서비스(1분이상 오디오/비디오 대상)
- Free : 무료, 20분 제한
- Basic : 12원 / 15초
2) STT 음성인식 CSR (CLOVA Speech Recognition)
- 4원 / 15초
3) TTS 음성재생(짦은문장) CLOVA Voice
- 월 9만원 ( 100만 글자까지 )
초과 시 1,000 글자당 100원
4) 얼굴인식 CLOVA Face Recognition(CFR) - 1,000원 /1,000건
네이버클라우드 포탈에 신규 가입을 하시면
무료 크레딧(개인회원 10만, 법인회원 30만)를 제공
각 서비스들을 로봇에 적용하기 전에 미리 테스트 해보시는 것을 추천.
8. 기타
개발 : 6주~수개월
QA : 2주 + a
Platform 서비스 적용시
계정관리 관리자모드 : Open API로만 제공되고 있으며 별도 관리툴은 제공하지 않습니다.
WakeUp Call : 별도협의필요
브랜드로고 사용
-> Open API 이용시에 별도 계약 필요 없이 사용 가능하지만, 로고 적용 후 승인과정이 요구된다고 합니다.