샘플링 전략 비교: 온도, Top-P, Top-K, Min-P, 그리고 실제로 프로덕션에서 효과적인 방법은 무엇인가
(dev.to)
LLM 서비스의 품질을 결정하는 핵심 변수인 Temperature, Top-P, Top-K, Min-P 샘플링 전략의 작동 원리와 각 파동이 출력 분포에 미치는 영향을 분석하여 최적의 텍스트 생성 설정을 찾는 방법을 제시합니다.
이 글의 핵심 포인트
- 1Temperature는 Logits를 변형하여 확률 분포의 날카로움이나 평탄함을 조절하며, 1보다 작으면 결정론적이고 1보다 크면 창의적인 출력을 유도함
- 2Top-P(Nucleus Sampling)는 누적 확률이 특정 임계값에 도달할 때까지의 토큰 집합만 유지하여 긴 꼬리(long tail) 문제를 해결함
- 3