동일한 모델, 다른 결과 — AgentKit Benchmark + OpenCode 통합
(dev.to)
AgentKit의 최신 업데이트는 동일한 모델(Gemma 4 31b)을 사용하더라도 워크플로우 제어(Plan gates, Skill injection)를 통해 작업 성공률을 20%에서 80%로 끌어올릴 수 있음을 증명했습니다. OpenCode와의 통합을 통해 구조화된 계획과 실행을 강제하는 '에이전틱 워크플로우(Agentic Workflow)'의 강력한 성능을 보여줍니다.
이 글의 핵심 포인트
- 1동일 모델(Gemma 4 31b) 사용 시 작업 성공률 20%에서 80%로 급증
- 2AgentKit의 워크플로우 제어(Plan gate, Skill injection)가 핵심 동력
- 3