AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 주요 출처
AI 모델 관련 최신 글
- 2
$5/월 DigitalOcean Droplet에서 Ollama + FastAPI로 Phi-3.5 Vision 배포하는 방법: GPT-4 Vision 비용의 1/220 수준의 경량 멀티모달 추론
고비용의 멀티모달 AI API 대신 월 30달러 수준의 저렴한 클라우드 서버에 Phi-3.5 Vision 모델을 구축하는 구체적인 방법을 다룹니다. Ollama와 FastAPI를 활용하여 비용 효율적이고 제어 가능한 자체 AI 추론 인프라를 구축하는 기술적 절차와 하드웨어 권장 사양을 제시합니다.
How to Deploy Phi-3.5 Vision with Ollama + FastAPI on a $5/Month DigitalOcean Droplet: Lightweight Multimodal Inference at 1/220th GPT-4 Vision Cost↗dev.to
- 3
.NET 데스크톱 앱에 Gemma 4 음성 인식 추가하기: llama-server 사이드카가 살아남은 방법
이 글은 .NET 환경에서 Gemma 4 음성 인식 엔진을 구현하기 위한 4가지 기술적 시도와 실패 과정을 상세히 분석합니다. 개발자는 ONNX Runtime의 구조적 미지원과 Python 환경의 배포 복잡성을 피하기 위해, 최종적으로 llama-server를 독립된 프로세스로 활용하는 사이드카 아키텍처를 구축하여 안정적인 온디바이스 추론을 구현했습니다.
Adding Gemma 4 speech recognition to a .NET desktop app: the llama-server sidecar that survived↗dev.to
- 4
헤르메스 에이전트, 글로벌 토큰 사용 주도. 도대체 무슨 뜻일까?
OpenRouter 랭킹에서 압도적인 토큰 사용량을 기록한 Hermes Agent의 사례는 AI 산업이 단순 챗봇에서 자율형 에이전트로 이동하고 있음을 보여줍니다. 에이전트 시대에는 토큰 소비량이 작업의 정확도가 아닌 복잡한 프로세스와 반복적 루프를 의미할 수 있으므로, 새로운 성과 지표와 비용 효율적인 설계가 핵심 과제로 떠오르고 있습니다.
Hermes Agent Leads Global Token Use. What Does That Actually Mean?↗dev.to
- 6
노트북LM-py: Google NotebookLM을 프로그래밍 가능한 API로, Claude Code 통합하여 전환 (매일 공개 소스 프로젝트 하나)
구글 NotebookLM의 내부 API를 역공학하여 개발된 notebooklm-py는 Python과 CLI를 통해 NotebookLM의 강력한 지식 관리 기능을 자동화할 수 있게 해줍니다. 특히 Claude Code와의 통합을 통해 Gemini의 근거 있는 지식 검색 능력과 Claude의 정교한 추론 능력을 결합한 하이브리드 AI 에이전트 구축이 가능해집니다.
One Open Source Project a Day (No. 77): notebooklm-py - Turning Google NotebookLM Into a Programmable API, With Claude Code Integration↗dev.to
- 8
Lynkr vs LiteLLM vs OpenRouter vs PortKey: 2026년 LLM 게이트웨이 선택하기
LLM 서비스의 비용 급증과 특정 제공업체에 대한 종속성 문제를 해결하기 위한 4가지 LLM 게이트웨이를 비교 분석합니다. 각 도구는 설정 편의성, 비용 최적화, 관측성, 로컬 모델 지원 여부에 따라 서로 다른 강점을 가지며, 개발 환경과 비즈니스 요구사항에 맞는 전략적 선택이 필요합니다.
Lynkr vs LiteLLM vs OpenRouter vs PortKey: Choosing an LLM Gateway in 2026↗dev.to
- 16
트레저 헌트 엔진: 문서가 진실을 멈춘 순간
대규모 문서 코퍼스에서 발생한 검색 엔진의 지연 시간 급증과 관련 없는 문서 반환 문제를 해결하기 위해, 기존 DiskANN 대신 실시간성이 보장되는 커스텀 HNSW 구조로 전환하고 리랭커 모델을 경량화 및 최신화했습니다. 이를 통해 인프라 비용을 오히려 줄이면서도 검색 정확도(Precision 92%)와 재현율(Recall 87%)을 동시에 개선하는 데 성공했습니다.
Treasure Hunt Engine: The Moment the Documentation Stopped Telling the Truth↗dev.to
- 22
Anthropic의 AI, 심각한 보안 취약점 1만 개 발견. 모든 브랜드에 미치는 영향은?
Anthropic의 Claude Mythos Preview가 Project Glasswing를 통해 수천 개의 제로데이 취약점을 자율적으로 발견하며 보안 패러다임을 뒤흔들고 있습니다. 이 모델은 단순한 버그 탐지를 넘어 여러 취약점을 결합해 공격 체인을 완성하고 실제 작동하는 증명(PoC)까지 생성하는 능력을 보여주었습니다.
Anthropic's AI Just Found 10,000 Critical Security Bugs. Here's Why That Matters for Every Brand↗dev.to















