GLM-5.2, 현재까지 가장 강력한 텍스트 전용 오픈 웨이트 LLM일 가능성이 높다

(simonwillison.net)

Simon Willison2026년 6월 17일AI 모델

GLM-5.2, 현재까지 가장 강력한 텍스트 전용 오픈 웨이트 LLM일 가능성이 높다

중국 Z.ai가 공개한 GLM-5.2는 753B 파라미터 규모의 강력한 오픈 웨이트 모델로, 압도적인 벤치마크 성능과 저렴한 비용을 통해 글로벌 LLM 시장의 경쟁 구도를 재편할 잠재력을 보여주고 있습니다.

이 글의 핵심 포인트

1중국 AI 연구소 Z.ai가 MIT 라이선스로 753B 파라미터 규모의 GLM-5.2 오픈 웨이트 모델 공개
2Artificial Analysis Intelligence Index에서 기존 주요 모델들을 제치고 1위 기록
3100만 토큰에 달하는 방대한 컨텍스트 창 제공 및 MoE 구조 채택
4OpenRouter 기준 GPT-5.5나 Claude 대비 매우 저렴한 API 비용(입력 $1.40/1M, 출력 $4.40/1M)
5작업당 출력 토큰 소모량이 다른 모델들에 비해 높은 '토큰 헝그리' 특성 보유

이 글에 대한 공공지능 분석

왜 중요한가?

오픈 웨이트 모델이 폐쇄형 모델(Closed-source)의 성능을 추월하기 시작했다는 점과 중국계 AI 기술력이 글로벌 벤치마크 정점에 도달했음을 시사합니다. 이는 고성능 AI를 저비용으로 활용하려는 개발자들에게 새로운 선택지를 제공합니다.

어떤 배경과 맥락이 있나?

MoE(Mixture of Experts) 구조를 채택하여 거대 파라미터 규모에도 불구하고 효율적인 추론을 가능케 했으며, 100만 토큰에 달하는 방대한 컨텍스트 창을 통해 긴 문서 처리 능력을 극대화했습니다.

업계에 어떤 영향을 주나?

매우 저렴한 API 비용은 AI 에이전트 및 코딩 어시스턴트를 개발하는 스타트업의 운영 비용(Burn rate)을 획기적으로 낮출 수 있는 기회를 제공합니다. 다만, 높은 출력 토큰 사용량은 대규모 서비스 운영 시 예상치 못한 비용 상승 리스크가 될 수 있습니다.

한국 시장에 어떤 시사점이 있나?

글로벌 수준의 고성능 오픈 모델이 저렴하게 공급됨에 따라, 한국 스타트업들은 자체 모델 개발보다는 이를 활용한 버티컬 AI 서비스 및 에이전트 워크플로우 최적화에 집중하는 전략이 유효할 것입니다.

이 글에 대한 큐레이터 의견

GLM-5.2의 등장은 '성능의 민주화'를 가속화할 것입니다. 특히 코딩과 웹 개발 분야에서 보여준 압도적인 벤치마크 결과와 파격적인 API 가격은, 자본력이 부족한 초기 스타트업이 고성능 AI 에이전트를 구축하는 데 있어 강력한 레버리지를 제공합니다. 이는 기존 빅테크 중심의 생태계에 균열을 일으킬 수 있는 중요한 변곡점입니다.

하지만 주의해야 할 트레이드오프가 명확합니다. 기사에서 지적했듯, 이 모델은 작업당 출력 토큰 소뮬량이 다른 모델보다 훨씬 많습니다. 이는 단순히 '저렴한 입력 비용'에 매몰되어 서비스를 설계할 경우, 실제 운영 단계에서 폭증하는 출력 비용으로 인해 수익성이 악화될 위험이 있음을 의미합니다. 또한, 특정 창의적 작업에서 이전 버전 대비 성능 퇴보가 관찰된 점은 모델의 안정성 측면에서 검토가 필요함을 시사합니다. 따라서 창업자들은 단순히 가격만 볼 것이 아니라, 서비스의 특성에 맞는 '토큰 효율성'과 '결과물의 일관성'을 면밀히 테스트한 후 도입 여부를 결정해야 합니다.

원문 보기 →