LM Studio의 새로운 headless CLI와 Claude Code를 활용하여 Gemma 4 로컬에서 실행하기
(ai.georgeliu.com)
LM Studio 0.4.0의 새로운 lms CLI와 llmster 엔진은 Google Gemma 4 같은 고성능 MoE 모델을 로컬에서 실행 가능하게 하여, 클라우드 API 비용과 보안 문제를 해결하고 AI 탈중앙화를 가속화합니다.
이 글의 핵심 포인트
- 1LM Studio 0.4.0은 headless `lms CLI`와 `llmster` 엔진을 도입하여 로컬 LLM 추론 환경을 개선하고 GUI 없이도 서버 및 CI/CD 환경에서 사용 가능합니다.
- 2Google Gemma 4 26B-A4B는 MoE(Mixture-of-Experts) 아키텍처를 통해 25.2B 파라미터 중 3.8B만 활성화하여 4B 모델과 유사한 추론 비용으로 10B급 품질(MMLU Pro 82.6%, AIME 2026 88.3%)을 제공합니다.