Show HN: 제가 Gemma 4 E2B를 벤치마크했습니다 – 2B 모델이 멀티턴에서 12B를 이겼습니다.
(aiexplr.com)
구글의 최신 소형 모델인 Gemma 4 E2B(2B)가 벤치마크 결과, 파라미터 수가 훨씬 많은 상위 모델들을 압도하는 놀라운 성능을 보여주었습니다. 특히 멀티턴 대화와 RAG 성능에서 세대 간의 비약적인 발전을 이루며, 소형 모델(SLM)의 효율성이 극대화되었음을 증명했습니다.
이 글의 핵심 포인트
- 1Gemma 4 E2B(2B)는 종합 점수 80.4%를 기록하며 4B 모델과 대등한 수준의 성능을 입증함
- 2멀티턴(Multi-turn) 대화 능력에서 70%를 기록, 상위 모델인 E4B(0%)를 압도하는 놀라운 성과를 보임
- 3