Ollama는 이제 Apple Silicon에서 MLX로 구동됩니다 (프리뷰)
(ollama.com)Ollama가 Apple MLX 프레임워크를 통한 프리뷰 버전을 공개하며, M5 GPU Neural Accelerators 활용으로 최대 2배 빠른 성능을 구현해 로컬 LLM 추론 효율과 온디바이스 AI 접근성을 혁신적으로 높였습니다.
이 글의 핵심 포인트
- 1Ollama 0.19는 Apple Silicon용으로 Apple MLX 프레임워크를 기반으로 구축되어, 로컬 LLM 성능을 크게 향상시켰습니다.
- 2Apple M5, M5 Pro, M5 Max 칩셋의 새로운 GPU Neural Accelerators를 활용하여 TTFT(time to first token) 및 토큰 생성 속도(tokens per second)를 가속화합니다.
- 3