AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 22 페이지
- 0
MCP 서버는 아마 과도한 권한을 가지고 있을 겁니다 - 이를 스캔하는 도구가 있습니다
MCP 서버의 설정 오류로 인한 권한 남용, 인증 부재, 프롬프트 인젝션 위험을 찾아내는 '@hailbytes/mcp-security-scanner'가 출시되었습니다. 이 도구는 정적 및 동적 스캔을 통해 보안 취약점을 식별하고, GitHub Code Scanning과 연동하여 개발 파이프라인 내에서 보안을 자동화할 수 있도록 지원합니다.
Your MCP Server Is Probably Overprivileged - Here's a Scanner For It↗dev.to
- 1
Maatru: 젬마 4로 구축된 아전트 기반의 텔루구어 문해력 학습 앱, 어린이들을 위해
인도 텔루구어 화자를 위한 문해력 학습 앱 Maatru는 부모가 잃어버린 모국어 문자를 아이들에게 가르치기 위해 개발되었습니다. 이 앱은 Gemma 4를 사용하여 학습 커리큘럼을 생성하고 부모용 학습 리포트를 작성하지만, 실제 학습 과정에서는 LLM 호출을 배제하여 지연 시간을 최소화한 효율적인 아키텍처를 채택했습니다.
Maatru: An agentic Telugu literacy app for kids, built with Gemma 4↗dev.to
- 7
사례 연구: CVE-2023-32233에서 Gemini 2.5 Pro의 안전 정렬 및 거부 동작 추적
이 연구는 Gemini 2.5 Pro가 Linux 커널의 특정 취약점(CVE-2023-32233)에 대해 시간이 흐름에 따라 어떻게 대응을 변화시켰는지 분석합니다. 4월에는 기술적 구현 가능성을 허용했으나, 5월 중순 안전 정렬 패치 이후에는 완전한 거부 반응을 보이는 등 LLM 가드레일의 업데이트 과정을 상세히 기록했습니다.
Case Study : Tracking Gemini 2.5 Pro's Safety Alignment & Refusal Behaviour on CVE-2023-32233↗dev.to
- 13
에이전트 워크플로우를 위한 최상위 10 AI 모델: 먼저 어떤 것을 시험해볼 것인가
본 기사는 단순 채팅을 넘어 계획, 도구 사용, 코드 실행 등이 필요한 AI 에이전트 구축을 위해 테스트해야 할 최상위 10개 모델과 우선순위를 제안합니다. 복잡한 추론에는 Claude Opus 4.7을, 비용 효율적인 하위 작업에는 Gemini Flash나 DeepSeek Flash를 활용하는 등 역할별 모델 분산 전략을 강조합니다.
Top 10 AI Models for Agent Workflows: Which Ones to Trial First↗dev.to
- 18
$5/월 DigitalOcean Droplet에서 Ollama + FastAPI로 Llama 3.2 Vision 배포하는 방법: GPT-4 Vision 비용의 1/200 수준의 멀티모달 추론
이 기사는 고비용의 상용 멀티모달 API 대신 오픈 소스 모델인 Llama 3.2 Vision을 저사양 클라우드 인프라에 배포하여 운영 비용을 극적으로 낮추는 기술적 가이드를 제공합니다. Ollama와 FastAPI를 활용해 누구나 10분 내외로 구축 가능한 실전적인 아키텍처를 제시하며, 대규모 이미지 처리 시 발생하는 비용 문제를 해결하는 대안을 제시합니다.
How to Deploy Llama 3.2 Vision with Ollama + FastAPI on a $5/Month DigitalOcean Droplet: Multimodal Inference at 1/200th GPT-4 Vision Cost↗dev.to
- 22
멀티 스트림 LLM: 프롬프트 병렬화/분리, 사고, I/O에 대한 새로운 논문
현재의 LLM 에이전트는 메시지를 순차적으로 주고받는 단일 스트림 구조로 인해 정보를 읽는 동시에 행동하거나 생각하는 등의 멀티태스킹이 불가능한 병목 현상을 겪고 있습니다. 본 논문은 입력, 사고, 출력을 별도의 병렬 스트림으로 분리하여 연산하는 Multi-Stream LLM 구조를 제안하며, 이를 통해 연산 효율성과 보안성, 모니터링 가능성을 동시에 개선할 수 있음을 보여줍니다.
Multi-Stream LLMs: new paper on parallelizing/separating prompts, thinking, I/O↗arxiv.org
















