OmniVoice: 600+ 언어를 지원하는 오픈 소스 TTS 및 제로샷 보이스 클로닝
(dev.to)
600개 이상의 언어와 정교한 보이스 클로닝을 지원하며 실시간보다 40배 빠른 추론 속도를 갖춘 오픈소스 TTS 모델 OmniVoice의 등장은 고가의 상용 API를 대체하며 음성 기반 서비스 개발의 경제적 진입 장벽을 획기적으로 낮출 전망입니다.
이 글의 핵심 포인트
- 1600개 이상의 언어를 제로샷(Zero-shot) 방식으로 지원
- 2실시간 대비 40배 빠른 추론 속도(RTF 0.025) 구현
- 3Apache 2.0 라이선스로 상업적 이용 및 로컬 배포 가능