LLM 아키텍처의 진화: KV 공유와 압축 어텐션을 통한 롱 컨텍스트 최적화 | 스타트업스쿨