Meta AI 뉴스
Meta의 AI 연구, Llama 오픈소스 전략, 소셜 미디어 AI 통합 소식을 전합니다.
총 345건·최신 업데이트
- 42
카글 GPU에서 사용 가능한 무료 35B 멀티모달 LLM 서버 — 모든 OpenAI 호환 클라이언트에서 접근 가능
이 글은 Kaggle의 무료 T4 GPU를 활용하여 Qwen3.6-35B 모델을 안정적인 API 서버로 구축하는 구체적인 아키텍처를 설명합니다. llama.cpp와 Cloudflare Quick Tunnel을 결과하여 세션 만료와 연결 끊김 문제를 해결하고, 모델과 바이너리를 Kaggle 데이터셋으로 관리하여 효율성을 극대화하는 노하우를 담고 있습니다.
Free 35B Multimodal LLM Server on Kaggle GPU — Accessible from Any OpenAI-Compatible Client↗dev.to
- 46
$12/월 DigitalOcean GPU Droplet에서 Hugging Face TGI로 Llama 3.2 배포하기: Claude 비용의 1/110 수준의 프로덕션 텍스트 생성
이 글은 고가의 LLM API 대신 DigitalOcean의 GPU Droplet을 사용하여 Llama 3.2 모델을 직접 호스팅하는 구체적인 가이드를 제공합니다. 월 12달러라는 파격적인 비용으로 프로덕션 수준의 텍스트 생성 환경을 구축하는 기술적 절차와 비용 효율성을 강조합니다.
How to Deploy Llama 3.2 with Hugging Face TGI on a $12/Month DigitalOcean GPU Droplet: Production Text Generation at 1/110th Claude Cost↗dev.to
- 47
Show HN: 저렴한 IM, Thinking Machines의 CPU 랩탑 데모
이 프로젝트는 Thinking Machines의 고가형 데모를 모방하여, 별도의 대규모 학습 없이도 로컬 CPU 환경에서 실시간 번역, 자세 감지, 배경 작업이 가능한 AI 에이전트를 구현했습니다. YOLO11, Silero, Llama-3.1 등 검증된 개별 모델들을 Python의 asyncio 이벤트 루프로 정교하게 결합하여 저비용·고효율의 멀티모달 경험을 제공합니다.
Show HN: Cheap-IM: Thinking Machines' demo on a CPU laptop↗github.com
- 50
$5/월 DigitalOcean Droplet에서 Ollama + MinIO Object Storage로 Llama 3.2 배포하는 방법: 분산 추론과 지속적인 모델 캐싱
이 글은 고가의 Claude나 GPT API 대신 월 5달러 규모의 저렴한 클라우드 인프라를 활용해 Llama 3.2를 직접 호스팅하는 구체적인 가이드를 제공합니다. MinIO를 활용한 모델 캐싱과 Docker 기반의 배점 방식을 통해 비용 효율적이면서도 확장 가능한 자체 추론 엔진 구축 전략을 다룹니다.
How to Deploy Llama 3.2 with Ollama + MinIO Object Storage on a $5/Month DigitalOcean Droplet: Distributed Inference with Persistent Model Caching↗dev.to
- 51
$5/월 DigitalOcean Droplet에서 Ollama + PostgreSQL 벡터 캐싱으로 Llama 3.2 배포하는 방법: 프로덕션 RAG을 위한 80% 저렴한 의미 검색
OpenAI와 Pinecone 등 외부 API에 의존하는 기존 RAG 방식의 높은 비용 문제를 해결하기 위해, 저렴한 VPS에 LMS와 pgvector를 구축하는 방법을 제시합니다. 벡터 캐싱을 통해 중복된 임베딩 연산을 제거함으로써 검색 비용을 획기적으로 낮추고 운영 효율성을 극대화하는 것이 핵심입니다.
How to Deploy Llama 3.2 with Ollama + PostgreSQL Vector Caching on a $5/Month DigitalOcean Droplet: 80% Cheaper Semantic Search for Production RAG↗dev.to
- 55
M&A 실사용 13개 AI 에이전트 시스템 구축 – 아키텍처 심층 분석
M&A 실사(Due Diligence) 시 발생하는 도메인 간 정보 단절 문제를 해결하기 위해 13개의 전문 AI 에이전트를 활용한 자동화 시스템을 구축했습니다. 이 시스템은 9개의 전문 에이전트와 4개의 메타 에이전트를 통해 데이터를 분석하며, 특히 규칙 기반 엔진을 활용해 도메인 간 상호 의존성을 찾아내는 뉴로심볼릭 접근법을 채택했습니다.
Building a 13-Agent AI System for M&A Due Diligence — Architecture Deep Dive↗dev.to












