Mamba-3는 추론 효율성을 최우선 목표로 설계된 새로운 상태 공간 모델(SSM)입니다. 기존 Mamba-2가 학습 속도에 집중한 것과 달리, Mamba-3는 더 풍부한 재귀 공식, 복소수 값 상태 추적, 그리고 정확도를 높이는 MIMO 변형을 통해 추론 성능을 대폭 개선했습니다. 그 결과, Llama-3.2-1B (1.5B 규모)를 포함한 기존 모델들을 모든 시퀀스 길이에서 사전 채우기 및 디코딩 지연 시간 면에서 능가합니다.
(together.ai)
Mamba-3는 복소수 값 상태 추적과 MIMO 변형을 통해 Llama-3.2-1B를 능가하는 압도적인 추론 효율성을 구현한 새로운 SSM으로, AI 서비스의 운영 비용을 절감하고 상업적 확장을 가속화할 혁신적인 대안입니다.
이 글의 핵심 포인트
- 1Mamba-3는 추론 효율성에 중점을 둔 새로운 상태 공간 모델(SSM)로, Llama-3.2-1B를 포함한 기존 LLM보다 빠른 사전 채우기 및 디코딩 지연 시간을 제공한다.