GLM 5.2, Semgrep IDOR 벤치마크에서 Claude 앞서

(news.hada.io)

Semgrep의 IDOR 취약점 탐지 벤치마크에서 Zhipu AI의 open-weight 모델 GLM 5.2가 단순 프롬프트 조건만으로 Claude Code보다 높은 F1을 기록함 실험은 데이터셋·평가 방식·시스템 프롬프트를 고정하고 모델과 하네스만 바꿔, 성능이 모델 자체에...

원문 보기 →

아직 댓글이 없습니다. 첫 댓글을 남겨보세요.