오픈AI "차세대 AI 평가, 벤치마크 넘어 '테스트 타임 컴퓨트'로 전환해야" | 스타트업스쿨