프롬프트 엔지니어링 뉴스
LLM 프롬프트 설계, 시스템 프롬프트, 컨텍스트 엔지니어링, 프롬프트 인젝션 방어 등에 관한 글.
총 514건
- 201
Claude Code의 케이브맨 플러그인을 "be brief"와 비교 측정해 보았습니다.
Claude Code의 토큰 압축 플러건인 'Caveman'과 단순 프롬프트 'be brief'의 성능을 비교 분석한 글입니다. 실험 결과 토큰 절감 효율은 비슷했으나, Caveman 플러그인은 단순 프롬프트가 제공하지 못하는 구조적 일관성, 강도 조절, 그리고 안전을 위한 자동 확장(Auto-Clarity) 기능을 통해 차별화된 가치를 제공함을 보여줍니다.
I benchmarked Claude Code's caveman plugin against "be brief."↗maxtaylor.me
- 205
Mistral Medium 3.5 128B, GPU 메모리 부족 없이 실행하는 방법
Mistral Medium 3.5 128B와 같은 초거대 모델을 로컬 또는 자체 서버에서 실행할 때 발생하는 VRAM 부족(OOM) 문제를 해결하기 위한 실전 가이드를 다룹니다. FP8 양자화 활용, vLLM의 텐서 병렬화(Tensor Parallelism), 컨텍스트 길이 제한 및 추론 노력(Reasoning Effort) 조절을 통해 효율적인 모델 서빙 전략을 제시합니다.
How to Serve Mistral Medium 3.5 128B Without Running Out of GPU Memory↗dev.to - 210
TurboQuant MacBook Pro 파트 2: 퍼플렉시티, KL 발산, 그리고 M5 Max에서의 비대칭 K/V
M5 Max MacBook Pro 환경에서 LLM의 KV 캐시 양자화 성능을 분석한 결과, 비대칭 K/V(Key/Value) 양자화 방식이 품질 저하를 최소화하면서도 컨텍스트 길이를 획기적으로 확장할 수 있음을 증명했습니다. 특히 q8_0(Key)와 turbo4(Value)를 결합한 비대칭 방식은 기존 방식이 메모리 부족(OOM)으로 실패하던 512K 컨텍스트에서도 안정적인 추론 성능을 보여주었습니다.
TurboQuant on a MacBook Pro, part 2: perplexity, KL divergence, and asymmetric K/V on M5 Max↗dev.to
- 211
OpenAI Codex 시스템 프롬프트, "고블린에 대해 절대 이야기하지 마라"라는 명시적 지시 포함
OpenAI의 Codex CLI 시스템 프롬프트가 공개되었는데, 여기에는 고블린, 트롤 등 특정 생명체에 대해 언급하지 말라는 이례적인 지시사항이 포함되어 있습니다. 이는 최근 모델에서 발생한 특정 주제에 대한 과도한 편향성 문제를 해결하기 위한 OpenAI의 긴급한 조치로 분석됩니다.
OpenAI Codex system prompt includes explicit directive to "never talk about goblins"↗arstechnica.com
- 212
2년 동안 내가 원했던 비동기 Python 작업 큐를 만들었다
이 기사는 기존 Python 작업 큐(Celery 등)가 가진 동기/비동기 컨텍스트 불일치와 문서화 부재 문제를 해결하기 위해 개발된 비동기 전용 작업 큐 'Repid'의 개발 여정을 다룹니다. 개발자는 AsyncAPI를 도입하여 브로커에 종속되지 않고 메시지 스키마를 표준화할 수 있는 차세대 비동기 작업 처리 아키텍처를 제안합니다.
I spent 2 years building the async Python task queue I wished existed↗dev.to
- 216
Claude 시스템 프롬프트 버그로 사용자 자금 낭비 및 관리 에이전트 손상 발생
Anthropic의 Claude Code CLI에서 시스템 프롬프트 주입 버거로 인해, 정상적인 코드 수정 요청을 AI 에이전트가 거부하는 현상이 발생하고 있습니다. 이 버그는 악성코드 방지 문구를 모든 파일 읽기 작업에 강제 적용함으로써, 멀티 에이전트 워크플로우의 신뢰성을 무너뜨리고 불필요한 토큰 비용을 발생시키고 있습니다.
Claude system prompt bug wastes user money and bricks managed agents↗github.com
- 218
사후 분석: Azure DevOps 2025 버그로 인해 .NET 8.0 앱이 잘못된 K8s 1.31 클러스터에 배포된 원인
Azure DevOps 2025의 특정 버전 버그로 인해 스테이징용 .NET 8.0 결제 API가 운영(Production) 클러스터에 잘못 배포되어 약 14만 2천 달러의 손실이 발생한 사건입니다. CI/CD 도구의 클러스터 컨텍스트 식별 오류가 코드의 무결성과 상관없이 대규모 장애를 초래할 수 있음을 보여줍니다.
Postmortem: How an Azure DevOps 2025 Bug Caused Our .NET 8.0 App to Deploy to the Wrong K8s 1.31 Cluster↗dev.to
- 219
Show HN: VoiceGoat – LLM 공격 연습을 위한 취약한 음성 에이전트
VoiceGoable은 음성 기반 AI 에이전트의 보안 취약점을 학습하고 실습할 수 있도록 설계된 의도적 취약점 플랫폼입니다. 프롬프트 인젝션, RAG 오염 등 LLM 애플리케이션의 주요 보안 위협을 CTF(Capture The Flag) 방식으로 체험하며 보안 전문가들이 레드팀 기술을 연마할 수 있게 돕습니다.
Show HN: VoiceGoat – A vulnerable voice agent for practicing LLM attacks↗github.com










