AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 7 페이지
- 3
GPUStack v2.2: 모델 서빙부터 토큰 연산까지, 컴퓨팅 풀링에서 GPUaaS까지
GPUStack v2.2는 모델 서빙의 가동 중단 문제를 해결하기 위해 런타임 전체에 걸친 헬스 체크와 향상된 로깅 기능을 도입했습니다. 또한 Multi-LoRA 지원을 통한 자원 효율화와 API 키별 토큰 사용량 추적 기능을 통해 AI 인프라 운영의 정밀도를 높였습니다.
GPUStack v2.2: From Model Serving to Token Operations, from Compute Pooling to GPU-as-a-Service↗dev.to
- 8
로컬 우선 멀티모달 AI: `iFly-Skills`, 프라이버시 및 효율성 격차를 어떻게 해소하는가
최근 개발자들 사이에서 데이터 보안과 주기 확보를 위해 클라우드 대신 로컬 환경에서 작동하는 AI 솔루션에 대한 관심이 높아지고 있습니다. iFLYTEK은 ASR, OCR 등 멀티모달 기술을 담은 'iFly-Skills'와 이를 자동화하는 'astron-rpa'를 오픈소스로 공개하며 기업용 프라이빗 AI 구축을 지원합니다.
Local-First Multimodal AI: How `iFly-Skills` Addresses the Privacy & Efficiency Gap↗dev.to
- 10
OpenAI 첫 맞춤형 칩 출시, Shopify는 모델 불문 AI 스택 구축, 그리고 Gemini 이미지 생성 무료 제공
OpenAI가 엔비디아 의존도를 낮추기 위해 추론 전용 커스텀 칩 'Jalapeño'를 공개했으며, Shopify는 다양한 모델을 유연하게 사용하는 AI 인프라 전략을 선보였습니다. 한편 구글은 개인화된 이미지 생성 기능을 무료화했고, 가트너는 향전 AI 코딩 비용이 개발자 연봉을 추월할 것이라는 경고를 내놓았습니다.
OpenAI Rolls Out Its First Custom Chip, Shopify Builds a Model-Agnostic AI Stack, and Gemini's Image Gen Goes Free↗dev.to
- 16
보안 연구원들, 프롬프트 인젝션으로 역할 모델 악용해 LLM에게 코카인 레시피를 얻어냈다
최근 연구에 따르면 LLM은 사용자 입력과 시스템 명령을 구분하기 위해 '역할(Role)' 태적을 사용하지만, 이는 스타일 기반의 불완전한 식별 방식이라 프롬프트 인젝션에 매우 취약합니다. 특히 공격자가 모델의 내부 추론 과정인 <think> 모드를 흉내 내는 'CoT Forgery' 기법을 사용할 경우, 안전 가드레일을 우회하여 유해한 정보를 생성할 확률이 급격히 높아집니다.
Security researchers tricked LLMs into giving them cocaine recipes by abusing role models for prompt injection↗theregister.com



















