Gemini API의 비용과 신뢰성 균형을 맞추는 새로운 방법
(blog.google)
구글 Gemini API가 비용 최적화를 위한 'Flex'와 높은 신뢰성을 위한 'Priority'라는 두 가지 새로운 서비스 티어를 출시했습니다. 개발자는 이제 단일 인터페이스 내에서 작업의 중요도에 따라 비용과 응답 속도를 정밀하게 제어할 수 있습니다.
이 글의 핵심 포인트
- 1Flex 티어 도입으로 Standard API 대비 50% 비용 절감 가능
- 2Flex 티어는 Batch API와 달리 동기식(Synchronous) 인터페이스를 제공하여 개발 복잡도 감소
- 3Priority 티어는 트래픽 급증 시에도 높은 신뢰성 및 우선순위 보장