프롬프트 엔지니어링 뉴스
LLM 프롬프트 설계, 시스템 프롬프트, 컨텍스트 엔지니어링, 프롬프트 인젝션 방어 등에 관한 글.
총 860건·최신 업데이트
- 401
5개의 AI 에이전트를 30일 동안 방치했을 때, 실제로 무엇이 망가졌고 무엇이 버텼는가
AI 에이전트를 30일간 무인 운영하며 발견한 4가지 주요 실패 사례(컨텍스트 비대화, API 제한, 인증 만료, 메모리 누수)와 이를 방지하기 위한 5가지 신뢰성 패턴을 다룹니다. 단순한 AI 모델 도입을 넘어, 실제 운영 환경에서 에이전트의 지속 가능성을 보장하기 위한 인프라적 안정성 확보의 중요성을 강조합니다.
[I Ran 5 AI Agents Unattended for 30 Days] What Actually Broke and What Held↗dev.to
- 403
AI 작성 테스트를 위한 변이 테스트 워크플로우 구축: Tautest
Tautest는 AI 코딩 에이전트가 작성한 테스트의 품질을 검증하기 위한 오픈소스 변이 테스트(Mutation Testing) 워크플로우 도구입니다. 단순히 테스트 통과 여부를 넘어, 코드의 경계값 등을 의도적으로 변형했을 때 테스트가 실패하는지를 확인하여 '취약한 테스트'를 찾아내고, 이를 AI가 수정할 수 있도록 최적화된 프롬프트를 생성해 줍니다.
I Built Tautest: A Mutation Testing Workflow for AI-Written Tests↗dev.to
- 404
LLM 토큰 비용이 불러올 '암호화된 코드'의 시대: 효율성인가 퇴보인가?
이 글은 LLM의 토큰 비용 최적화 압박이 소프트웨어 개발의 패러다임을 인간의 가독성 중심에서 기계의 효율성 중심으로 변화시킬 수 있다고 분석합니다. 비용 절감을 위해 '동굴인 프롬프트'와 같은 극단적 최적화가 나타나면서, 미래의 코드는 인간이 이해하기 어려운 암호화된 형태로 변할 수 있다는 전망을 제시합니다.
Evolved antennas, LLM-generated code, and a potential antifuture↗ericwbailey.website
- 410
클로드(Claude)가 모든 프로젝트 탭에서 실행되는 IDE를 만들었습니다 — 헤르메스(Hermes) 1.1.5 내부 해부
Hermes IDE는 여러 프로젝트를 하나의 창에서 동시에 관리할 수 있는 '네이전트 중심(Agent-native)'의 차세대 IDE입니다. 각 세션이 독립적인 작업 디렉토리, 모델, 권한 및 MCP 플러그인을 가질 수 있도록 설계되어, 개발자의 고질적인 문제인 컨텍스트 스위칭 비용을 혁신적으로 줄여줍니다.
I Built an IDE Where Claude Runs in Every Project Tab — Inside Hermes 1.1.5↗dev.to
- 420
Show HN: nocal, 당신의 한 주를 작업 공간으로 바꿔주는 캘린더
nocal은 단순한 일정 관리를 넘어, AI 에이전트가 프로젝트 맥락과 노트 기록을 직접 조회할 수 있도록 설계된 차세대 워크스페이스 캘린더입니다. MCP(Model Context Protocol)를 활용하여 Cursor, Claude, ChatGPT와 같은 AI 도구들이 사용자의 작업 컨텍스트를 실시간으로 파악할 수 있게 돕는 것이 핵심입니다.
Show HN: nocal is a calendar that turns your week into a workspace↗nocal.app













