Anthropic, 3월 6일 캐시 TTL 다운그레이드
(github.com)
Anthropic의 프롬프트 캐시 TTL(Time To Empy)이 2026년 3월 초, 기존 1시간에서 5분으로 예고 없이 축소되었습니다. 이로 인해 캐시 생성 비용이 20~32% 급증했으며, API 사용량 쿼타(Quota) 소모가 가속화되어 AI 서비스 운영 비용에 직접적인 타격을 입혔습니다.
- 1Anthropic 프롬프트 캐시 TTL이 1시간에서 5분으로 급격히 축소 (2026년 3월 초)
- 2캐시 생성 비용(Cache Write)이 기존 대비 약 20~32% 증가하는 결과 초래
- 3분석 데이터 기준, 4개월간 약 17.1%의 불필요한 비용 낭비 발생 확인
- 4사용자에게 사전 공지 없이 진행된 'Silent Regression' 형태의 변경
- 5해당 이슈는 Anthropic 측에서 'Closed as not planned'로 처리되어 즉각적인 복구 불투명
왜 중요한가
배경과 맥락
업계 영향
한국 시장 시사점
이번 사건은 AI 스타트업 창업자들에게 '인프라 리스크 관리'라는 무거운 과제를 던져줍니다. 모델의 성능(Intelligence)만큼이나 중요한 것이 인프라의 안정적인 비용 구조입니다. Anthropic이 이 이슈를 'Not Planned(계획되지 않음)'로 종결했다는 점은, 향후 유사한 비용 상승 압박이 언제든 재발할 수 있음을 시사합니다.
창업자들은 두 가지 전략적 대응이 필요합니다. 첫째, '비용 가시성(Cost Visibility)'의 확보입니다. 단순히 API 청구액만 볼 것이 아니라, 캐시 생성/읽기 비율과 TTL 변화를 실시간으로 추적하는 모니터링 대시보드를 구축해야 합니다. 둘째, '모델 아키텍처의 유연성'입니다. 특정 모델의 캐싱 효율이 급락할 경우, 즉시 다른 모델(예: GPT-4o 등)로 워크로드를 분산할 수 있는 멀티 모델 전략(Multi-model Strategy)이 생존을 위한 필수 방어 기제가 될 것입니다.
댓글
아직 댓글이 없습니다. 첫 댓글을 남겨보세요.