LLM 추론 비용 최적화: 캐싱, 라우팅, 압축 3단계 전략 | StartupSchool