코히어(Cohere)가 오픈소스 기반의 최첨단 자동 음성 인식(ASR) 모델 '트랜스크라이브(Transcribe)'를 발표했습니다. 이 모델은 허깅페이스 오픈 ASR 리더보드에서 5.42%의 평균 단어 오류율(WER)로 1위를 기록하며 위스퍼 라지 v3 등을 능가하는 정확도를 보여줍니다. 한국어를 포함한 14개 언어를 지원하며, 생산 환경에 최적화된 설계와 아파치 2.0 라이선스로 제공됩니다.
(cohere.com)코히어(Cohere)가 오픈소스 기반의 최첨단 자동 음성 인식(ASR) 모델 '트랜스크라이브(Transcribe)'를 발표했습니다. 이 모델은 허깅페이스 오픈 ASR 리더보드에서 5.42%의 평균 단어 오류율(WER)로 1위를 기록하며 위스퍼 라지 v3 등을 능가하는 정확도를 보여줍니다. 한국어를 포함한 14개 언어를 지원하며, 생산 환경에 최적화된 설계와 아파치 2.0 라이선스로 제공됩니다.
- 1코히어 트랜스크라이브는 허깅페이스 오픈 ASR 리더보드에서 평균 WER 5.42%로 1위를 차지, 위스퍼 라지 v3 등 경쟁 모델을 능가하는 최고 수준의 정확도를 제공합니다.
- 2이 모델은 Apache 2.0 라이선스로 완전 오픈 소스 형태로 제공되며, 20억 파라미터의 Conformer-based 인코더-디코더 아키텍처를 사용합니다.
- 3한국어를 포함하여 영어, 중국어, 일본어 등 총 14개 언어를 지원하여 글로벌 및 지역 시장에서의 활용성이 매우 높습니다.
- 4생산 환경에 최적화되어 낮은 WER과 함께 효율적인 추론 풋프린트 및 서빙 효율성을 강조하며 설계되었습니다.
- 5오픈 소스 사용 외에 코히어의 보안이 강화된 완전 관리형 추론 플랫폼인 Model Vault를 통해서도 이용 가능합니다.
왜 중요한가
배경과 맥락
업계 영향
한국 시장 시사점
댓글
아직 댓글이 없습니다. 첫 댓글을 남겨보세요.