AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 47 페이지
- 0
Google Home의 Gemini AI, 더 복잡한 요청도 처리 가능
구글 홈의 Gemini AI가 3.1 버전으로 업그레이드되어, 단일 음성 명령으로 여러 작업을 동시에 처리하고 복잡한 멀티스텝 요청을 수행할 수 있게 되었습니다. 또한 웹 기반 관리 기능인 'Ask Home on Web'과 알림창 내 즉각 제어가 가능한 '퀵 액션' 기능이 추가되어 스마트 홈 제어의 편의성이 대폭 강화되었습니다.
Google Home’s Gemini AI can handle more complicated requests↗theverge.com
- 2
GLM-5V-Turbo: 멀티모달 에이전트를 위한 네이티브 기반 모델으로의 진전
GLM-5V-Turbo는 멀티모달 인지 능력을 단순한 보조 인터페이스가 아닌 추론, 계획, 도구 사용의 핵심 엔진으로 통합한 차세대 네이티브 멀ument 기반 모델입니다. 이미지, 비디오, 웹페이지, GUI 등 다양한 시각적 컨텍스트를 직접 이해하고 실행할 수 있는 '멀티모달 에이전트' 구현을 위한 기술적 진보를 보여줍니다.
GLM-5V-Turbo: Toward a Native Foundation Model for Multimodal Agents↗arxiv.org
- 3
제마 4 가속화: 멀티 토큰 예측 드래프터를 활용한 더 빠른 추론
구글이 Gemma 4 모델의 추론 속도를 최대 3배까지 높일 수 있는 '멀티 토큰 예측(MTP) 드래프터'를 공개했습니다. 스펙큘레이티브 디코딩(Speculative Decoding) 기술을 활용해 모델의 추론 품질 저하 없이 지연 시간(Latency)을 획기적으로 단능화하여, 에지 디바이스부터 클라우드까지 더 빠르고 효율적인 AI 서비스 구현을 가능하게 합니다.
Accelerating Gemma 4: faster inference with multi-token prediction drafters↗blog.google
- 8
LLM API 런타임 규정 준수 프록시 (EU AI Act)
202나 2026년 8월 시행될 EU AI Act 및 캘리포니아 SB 942 규제에 대응하기 위해, LLM API 요청을 실시간으로 모니터링하고 보안 위협을 차단하는 Go 기반 리버스 프록시 솔루션 'AIR Blackbox'를 소개합니다. 이 도구는 프롬프트 인젝션 탐지, 개인정보(PII) 유출 방지, 위변조 불가능한 감사 로그 생성을 통해 AI 에이전트의 규제 준수를 자동화합니다.
Runtime Compliance Proxy for LLM APIs (EU AI Act)↗dev.to
- 11
출판사들이 Meta를 상대로 AI의 '단어 그대로' 복제 혐의로 소송 제기
메타(Meta)가 Llama AI 모델을 학습시키는 과정에서 LibGen, Sci-Hub 등 불법 복제 사이트의 저작물을 무단으로 사용했다는 혐의로 대형 출판사들로부터 집단 소송을 당했습니다. 이번 소송은 단순히 AI 학습의 '공정 이용(Fair Use)' 여부를 넘어, '불법 데이터셋 사용'이라는 구체적인 저작권 침해를 다루고 있어 AI 업계의 큰 파장이 예상됩니다.
Book publishers sue Meta over AI’s ‘word-for-word’ copying↗theverge.com
- 14
$28/월 DigitalOcean GPU Droplet에서 vLLM으로 Mixtral 8x7B 배포하는 방법: Mixture-of-Experts 추론, API 비용의 1/75로
OpenAI나 Claude 같은 고가의 LLM API 대신, DigitalOcean의 저렴한 GPU Droplet과 vLLM 엔진을 활용해 Mixtral 8x7B 모델을 직접 배포함으로써 추론 비용을 최대 1/75 수준으로 절감하는 방법을 소개합니다. 이 방식은 비용뿐만 아니라 지연 시간(Latency)과 데이터 프라이버시 측면에서도 압도적인 우위를 점할 수 있음을 보여줍니다.
How to Deploy Mixtral 8x7B with vLLM on a $28/Month DigitalOcean GPU Droplet: Mixture-of-Experts Inference at 1/75th API Cost↗dev.to
- 15
프로덕션 환경에서 5개의 AI API를 사용할 때 깨지는 것들 (2026년판)
2026년 AI 서비스 개발의 핵심인 멀티 모델(Multi-model) 전략은 모델별 응답 형식, 스트리밍 규격, 레이트 리밋(Rate Limit)의 파편화로 인해 심각한 운영 장애를 초래할 수 있습니다. 이를 극복하기 위해서는 각 API의 불일치를 표준화하는 어댑터 레이어 구축과 연쇄적 장애를 방지하는 정교한 트래픽 관리 설계가 필수적입니다.
What Breaks When You Use 5 Different AI APIs in Production (2026 Edition)↗dev.to
- 17
Google Chrome, 동의 없이 4GB AI 모델을 기기에 자동 설치
구글 크롬이 사용자 동의 없이 약 4GB 크기의 Gemini Nano AI 모델(weights.bin)을 사용자 기기에 자동으로 설치하고 있다는 사실이 밝혀졌습니다. 이 과정에서 사용자 선택권이 배제되었을 뿐만 아니라, 대규모 다운로드로 인한 환경적 비용과 GDPR 등 개인정보 보호 규정 위술 가능성이 제기되고 있습니다.
Google Chrome silently installs a 4 GB AI model on your device without consent↗thatprivacyguy.com















