LLM 강화학습의 혁신: 단일 레이어 학습으로 전체 성능 구현 가능 | 스타트업스쿨