RAG 뉴스
검색 증강 생성(RAG) 기술의 최신 논문, 구현 패턴, 실무 적용 사례를 전합니다.
총 55건·최신 업데이트
RAG 핵심 글
RAG 관련 전체 글
- 2
GLIA: AI 에이전트를 위한 홀로그래픽 메모리, 그래프도 RAG도 아니다
GLIA는 단순 텍텐츠 청킹 기반의 RAG나 복잡한 그래프 구조 대신, 순환 컨볼루션을 이용한 홀로그래픽 패턴 저장 방식을 채택하여 AI 에이전트의 맥락 유지 문제를 해결합니다. 이를 통해 데이터 손실에 강하고 연상 추론이 가능한 구조적 메모리를 구축하며, MCP 서버를 통해 기존 AI 코딩 도구에 즉시 통합 가능합니다.
GLIA — A holographic memory for AI agents that isn't a graph and isn't RAG↗dev.to
- 3
RAG 시리즈 (22): 긴 컨텍스트 vs RAG — RAG이 정말 필요한가?
최근 LLM의 컨텍스트 윈도우가 비약적으로 확장되면서 RAG의 필요성에 의문이 제기되고 있으나, 비용, 지연 시간, 정보 누락(Lost in the Middle) 등의 문제로 인해 RAG는 여전히 필수적입니다. 본 글은 문서의 규모와 업데이트 빈도에 따라 롱 컨텍스트와 RAG 중 최적의 아키텍처를 선택하기 위한 구체적인 프레임워크를 제시합니다.
RAG Series (22): Long Context vs RAG — Do We Even Need RAG?↗dev.to
- 4
RAG 시리즈 (19): 점진적 업데이트 - 지식 기반을 최신 상태로 유지하기
데이터가 지속적으로 변하는 실제 운영 환경에서 RAG 인덱스를 효율적으로 관리하는 점진적 업데이트(Incremental Update) 방법을 다룹니다. LangChain의 Indexing API를 활용해 해시 값을 비교함으로써, 변경된 문서만 임베팅하고 삭제된 문서를 정리하여 비용과 시간을 최적화하는 구체적인 구현 방안을 제시합니다.
RAG Series (19): Incremental Updates — Keeping the Knowledge Base Fresh↗dev.to
- 5
$5/월 DigitalOcean Droplet에서 Ollama + MinIO Object Storage로 Llama 3.2 배포하는 방법: 분산 추론과 지속적인 모델 캐싱
이 글은 고가의 Claude나 GPT API 대신 월 5달러 규모의 저렴한 클라우드 인프라를 활용해 Llama 3.2를 직접 호스팅하는 구체적인 가이드를 제공합니다. MinIO를 활용한 모델 캐싱과 Docker 기반의 배점 방식을 통해 비용 효율적이면서도 확장 가능한 자체 추론 엔진 구축 전략을 다룹니다.
How to Deploy Llama 3.2 with Ollama + MinIO Object Storage on a $5/Month DigitalOcean Droplet: Distributed Inference with Persistent Model Caching↗dev.to
- 6
$5/월 DigitalOcean Droplet에서 Ollama + PostgreSQL 벡터 캐싱으로 Llama 3.2 배포하는 방법: 프로덕션 RAG을 위한 80% 저렴한 의미 검색
OpenAI와 Pinecone 등 외부 API에 의존하는 기존 RAG 방식의 높은 비용 문제를 해결하기 위해, 저렴한 VPS에 LMS와 pgvector를 구축하는 방법을 제시합니다. 벡터 캐싱을 통해 중복된 임베딩 연산을 제거함으로써 검색 비용을 획기적으로 낮추고 운영 효율성을 극대화하는 것이 핵심입니다.
How to Deploy Llama 3.2 with Ollama + PostgreSQL Vector Caching on a $5/Month DigitalOcean Droplet: 80% Cheaper Semantic Search for Production RAG↗dev.to
- 9
드론 제조업체 ACSL과 Draganfly, 일본산 NDAA 규정 준수 드론을 캐나다 시장에 공급하기 파트너십 체결; 독점 유통 계약 체결 및 기술 통합 시작
일본 최대 드론 제조사 ACSL과 캐나다의 Draganfly가 독점 유통 계약을 체결하고 기술 통합을 시작했습니다. 이번 파트너십을 통해 보안성이 강화된 ACSL의 SOTEN 플랫폼이 캐나다 시장에 공급되며, 양사 드론 플랫폼 간의 상호 운용성을 높이는 기술적 협력도 병행될 예정입니다.
Drone Makers ACSL and Draganfly Partner to Bring NDAA-Compliant Japanese Drones to Canadian Market; Signs Exclusive Distributor Agreement and Launches Technology Integration↗suasnews.com
- 12
온톨로지, 보안, 자가 진화 기능을 갖춘 로컬 그래프-RAG 엔진 구축: 미니 Palantir (알파)
PROJECT JAMES는 보안과 온톨로지를 결합한 로컬 실행형 Graph-RAG 엔진으로, 데이터 유출 걱정 없이 개인이나 기업이 로컬 환경에서 강력한 지식 엔진을 구축할 수 있게 설계되었습니다. Ollama를 활용한 100% 로컬 구동, 3단계 보안 모델(RBAC, ABAC, 명령 격리), 그리고 자가 진화 기능을 통해 '미니 팔란티어(Mini Palantir)'를 지향합니다.
Building a Mini Palantir: A Local Graph-RAG Engine with Ontology, Security, and Self-Evolution (Alpha)↗dev.to
- 14
검색 증강 생성 (RAG): 외부 지식으로 대규모 언어 모델 강화
RAG(검색 증강 생성)는 LLM의 고질적인 문제인 환각(Hallucination)과 정보의 노후화 문제를 해결하기 위해 외부 지식을 검색하여 모델에 전달하는 기술입니다. 검색(Retriever)과 생성(Generator)을 결합하여 최신 데이터와 도메인 특화 지식을 반영한 정확한 답변을 가능하게 합니다.
Retrieval Augmented Generation (RAG): Enhancing Large Language Models with External Knowledge↗dev.to
- 15
Dirty Frag" (CVE-2026-43284): 8일 만에 발견된 두 번째 Linux 루트 익스플로잇
Linux 커널의 IPsec/ESP 경로 내 메모리 처리 로직 결함을 이용해 루트 권한을 탈취할 수 있는 'Dirty Frag'(CVE-2026-43284) 취약점이 발견되었습니다. 이는 'Copy Fail' 이후 8일 만에 등장한 두 번째 대규모 익스플로잇으로, 서버 운영자는 즉각적인 커널 업데이트와 재부팅이 필요합니다.
"Dirty Frag" (CVE-2026-43284): The Second Linux Root Exploit in Eight Days↗copahost.com
- 16
Terraform 모놀리스를 Terragrunt로 마이그레이션: 다운타임 없는 스테이트 슬라이싱
단일 Terraform 상태 파일(Monolith)로 관리되던 19개의 AWS 인프라 컴포넌트를 Terragrunt를 사용하여 13개의 독립적인 모듈로 분리한 기술적 사례를 다룹니다. 인프라의 재생성이나 다운타임 없이 '상태 슬라이싱(State Slicing)' 기술을 통해 인프라 변경의 위험 범위를 줄이고 작업 효율성을 극대화했습니다.
Migrating a Terraform Monolith to Terragrunt: State Slicing Without Downtime↗dev.to
- 17
RAG을 넘어: 에이전트 시대의 진정한 경쟁력은 지식 엔지니어링이다
단순한 RAG(검색 증강 생성)를 넘어, 에이전트의 진정한 지능은 지식을 구조화하고 지속적으로 학습시키는 '지식 엔지니어링(Knowledge Engineering)'에서 결정됩니다. 에이전트가 정보를 단순히 검색하는 수준을 넘어, 지식을 체계적인 메모리로 구축하여 스스로 진화할 수 있는 아키텍처를 설계하는 것이 차세대 AI 경쟁력의 핵심입니다.
Beyond RAG: Why Knowledge Engineering Becomes the Real Moat in the Agent Era↗dev.to
- 19
AI는 어떻게 정보를 얻을까? 학습 데이터, RAG, MCP, 그리고 API 완벽 해설
AI의 지식은 학습 데이터(Training Data), 검색 증강 생성(RAG), 그리고 API/MCP와 같은 실시간 도구 접근이라는 세 가지 계층을 통해 형성됩니다. 이 구조를 이해하는 것은 AI의 답변 신뢰도를 판단하고, 기업의 브랜드 가시성을 AI 검색 엔진 내에서 확보하는 데 필수적입니다.
How Does AI Get Its Information? Training Data, RAG, MCPs, and APIs Explained↗ahrefs.com











