RLHF vs DPO vs KTO: LLM 정렬(Alignment) 방법론 비교 및 선택 가이드 | 스타트업스쿨