TinyLoRA: 13개 파라미터로 추론 학습
(arxiv.org)
TinyLoRA는 단 13개 파라미터(bf16 기준 26바이트)만을 사용하여 80억 파라미터 규모의 Qwen2.5 모델이 GSM8K 벤치마크에서 91%의 추론 정확도를 달성하는 획기적인 기술입니다. 이는 기존 LoRA의 한계를 넘어 최소 1개 파라미터까지 어댑터를 축소할 수 있으며, 강화 학습(RL)을 통해서만 이처럼 강력한 성능을 발휘합니다.
이 글의 핵심 포인트
- 1TinyLoRA는 8B 파라미터 Qwen2.5 모델을 단 13개 파라미터(bf16 기준 26바이트) 학습으로 GSM8K에서 91% 정확도를 달성했습니다.
- 2기존 LoRA의 한계를 넘어 어댑터 크기를 1개 파라미터까지 축소하여 매우 높은 파라미터 효율성을 보여줍니다.
- 3