에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개
(platum.kr)
에임인동텔리전스가 10개국의 법률과 문화적 맥락을 반영해 LLM의 진정한 안전성을 측정하는 글로벌 벤치마크 ‘XL-SafetyBench’를 공개하며, 단순한 유해 차단을 넘어 국가별 특화된 리스크를 식별하는 새로운 AI 보안 표준을 제시했습니다.
이 글의 핵심 포인트
- 1에임인텔리전스, 10개국 법률·문화 반영 'XL-SafetyBench' 공개
- 237개 주요 LLM 대상, 5,500개의 현지화된 테스트 케이스 활용
- 3단순 답변 거부를 넘어 실제 위험 인지 여부를 측정하는 '안전성의 착시' 방지 기능