LM Studio의 새로운 headless CLI와 Claude Code를 활용하여 Gemma 4 로컬에서 실행하기
(ai.georgeliu.com)
LM Studio 0.4.0은 새로운 `llmster` 엔진과 `lms CLI`를 도입하여 Google Gemma 4 26B-A4B와 같은 MoE(Mixture-of-Experts) 모델을 로컬에서 효율적으로 실행할 수 있게 합니다. 이로써 클라우드 API의 높은 비용, 개인 정보 보호 문제, 그리고 네트워크 지연 없이 개인 워크스테이션에서 고성능 LLM을 비용 효율적이고 안전하게 활용하는 길이 열렸습니다.
이 글의 핵심 포인트
- 1LM Studio 0.4.0은 headless `lms CLI`와 `llmster` 엔진을 도입하여 로컬 LLM 추론 환경을 개선하고 GUI 없이도 서버 및 CI/CD 환경에서 사용 가능합니다.
- 2Google Gemma 4 26B-A4B는 MoE(Mixture-of-Experts) 아키텍처를 통해 25.2B 파라미터 중 3.8B만 활성화하여 4B 모델과 유사한 추론 비용으로 10B급 품질(MMLU Pro 82.6%, AIME 2026 88.3%)을 제공합니다.