AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 28 페이지
- 15
$12/월 DigitalOcean GPU Droplet에서 Hugging Face TGI로 Llama 3.2 배포하기: Claude 비용의 1/110 수준의 프로덕션 텍스트 생성
이 글은 고가의 LLM API 대신 DigitalOcean의 GPU Droplet을 사용하여 Llama 3.2 모델을 직접 호스팅하는 구체적인 가이드를 제공합니다. 월 12달러라는 파격적인 비용으로 프로덕션 수준의 텍스트 생성 환경을 구축하는 기술적 절차와 비용 효율성을 강조합니다.
How to Deploy Llama 3.2 with Hugging Face TGI on a $12/Month DigitalOcean GPU Droplet: Production Text Generation at 1/110th Claude Cost↗dev.to
- 17
OpenAI, ChatGPT를 금융 자문가로 전환했습니다 (직접 만드는 방법은 여기)
OpenAI가 Plaid API를 활용해 사용자의 실제 금융 데이터를 실시간으로 조회하고 분석할 수 있는 'Personal Finance' 기능을 ChatGPT에 도입했습니다. 이 기능은 단순한 가계부를 넘어 자연어 질문을 통해 소비 패턴 분석 및 맞춤형 재무 계획 수립을 지원하는 강력한 금융 비서 역할을 수행합니다.
OpenAI Just Turned ChatGPT into a Financial Advisor (Here's How to Build Your Own)↗dev.to
- 18
RAG 시리즈 (22): 긴 컨텍스트 vs RAG — RAG이 정말 필요한가?
최근 LLM의 컨텍스트 윈도우가 비약적으로 확장되면서 RAG의 필요성에 의문이 제기되고 있으나, 비용, 지연 시간, 정보 누락(Lost in the Middle) 등의 문제로 인해 RAG는 여전히 필수적입니다. 본 글은 문서의 규모와 업데이트 빈도에 따라 롱 컨텍스트와 RAG 중 최적의 아키텍처를 선택하기 위한 구체적인 프레임워크를 제시합니다.
RAG Series (22): Long Context vs RAG — Do We Even Need RAG?↗dev.to


















