LLM의 지난 6개월, 5분 안에 파악하기

(simonwillison.net)

Hacker News1일 전AI 모델

2025년 11월 코딩 에이전트의 실무 적용 가능성 확보와 개인용 AI 비서인 'Claws'의 부상을 중심으로, 지난 6개월간 발생한 LLM 기술의 급격한 변곡점과 모델 경쟁의 양상을 분석합니다.

이 글의 핵심 포인트

12025년 11월, 코딩 에이전트가 '실무 가능' 수준으로 진화하며 개발 패러다임 전환
2Claude 4.5, GPT-5.1, Gemini 3 등 주요 모델 간의 극심한 성능 교체 주기 발생
3OpenClaw와 같은 개인용 AI 비서(Claws)의 부상 및 로컬 컴퓨팅 수요 증가
4Google의 Gemma 4 출시로 오픈 웨이트(Open Weights) 모델의 경쟁력 강화
5강화학습(RL)을 통한 검증 가능한 보상 체계가 모델의 코딩 정확도 향상의 핵심 동력

이 글에 대한 공공지능 분석

왜 중요한가?

코딩 에이전트가 '실무 가능' 수준으로 진화하며 소프트웨어 개발의 경제적 임계점을 돌파했습니다. 또한, 개인용 AI 비서의 등장은 AI가 단순 도구를 넘어 자율적 에이전트로 진화하고 있음을 증명합니다.

어떤 배경과 맥락이 있나?

OpenAI와 Anthropic이 도입한 '검증 가능한 보상을 통한 강화학습(RL)' 기술이 코딩 정확도를 획기적으로 높였습니다. 이는 모델 간 성능 우위가 매우 짧은 주기로 교체되는 극심한 경쟁 환경을 조성했습니다.

업계에 어떤 영향을 주나?

개발 프로세스의 자동화가 가속화됨에 따라, 단순 코딩 역량보다는 AI 에이전트의 워크플로우를 설계하고 관리하는 능력이 핵심 경쟁력이 될 것입니다. 또한, 로컬 컴퓨팅 자원을 활용하는 개인용 AI 생태계가 형성될 전망입니다.

한국 시장에 어떤 시사점이 있나?

한국 스타트업은 모델 자체의 개발보다는 고도화된 에이전트를 활용한 버티컬 서비스 개발에 집중해야 합니다. 특히 개인화된 'Claws' 생태계에 대응할 수 있는 로컬 실행형 AI 서비스 기회를 모색해야 합니다.

이 글에 대한 큐레이터 의견

이제 특정 LLM의 성능에 의존하는 것은 매우 위험한 전략입니다. 6개월 만에 최강 모델이 다섯 번이나 바뀌었다는 사실은, 모델의 성능(Vibes)보다는 모델을 어떻게 오케스트레이션하여 신뢰할 수 있는 에이전트를 만들 것인가라는 '시스템 설계'의 중요성을 시사합니다. 창업자들은 모델 교체에 유연한 아키텍처를 구축하는 데 집중해야 합니다.

또한, 'Claws'의 부상은 AI가 개인의 디지털 환경에 깊숙이 침투하고 있음을 보여줍니다. Mac Mini 판매량 증가가 AI 에이전트 구동을 위한 것이라는 점은, 향후 AI 서비스가 클라우드를 넘어 로컬 컴퓨팅 및 하드웨어와 밀접하게 결합될 것임을 암시합니다. 에이전트의 자율성과 제어권 사이의 균형을 맞추는 기술적 보안과 사용자 경험 설계가 차세대 AI 비즈니스의 핵심 승부처가 될 것입니다.

원문 보기 →