AI 에이전트의 함정: 벤치마록 점수가 아닌 '마라톤' 수행력을 보라 | 스타트업스쿨