프롬프트 엔지니어링 뉴스
LLM 프롬프트 설계, 시스템 프롬프트, 컨텍스트 엔지니어링, 프롬프트 인젝션 방어 등에 관한 글.
총 1,202건·최신 업데이트
- 341
하나의 프롬프트가 프로세스가 될 때: AI 스킬 내부에서 책임 분담을 어떻게 나눴는지
복잡한 코딩 작업을 처리할 때 발생하는 거대 프롬프트의 관리 불가능 문제를 해결하기 위해, AI 내부 로직을 입력 분석, 리스크 검토, 품질 체크 등으로 분리하는 'AI 스기' 설계 방법론을 제안합니다. 사용자는 단일한 결과물을 받지만, AI는 구조화된 단계별 책임을 수행함으로써 훨씬 더 실행 가능하고 정교한 답변을 제공할 수 있습니다.
When One Prompt Becomes a Process: How I Split Responsibility Inside an AI Skill↗dev.to
- 346
Launch HN: Intuned (YC S22) - 코드로서 안정적인 브라우저 자동화 구축 및 실행
Intuned Agent는 사용자의 프롬프트와 스키마를 바탕으로 웹 스크래핑, 크롤링, RPA 및 AI 자동화에 필요한 브라우저 자동화 코드를 자동으로 생성하고 관리하는 플랫폼입니다. 특히 웹사이트 구조 변경 시 AI가 코드를 스스로 수정하며, 대규모 확장이 가능한 인기프라와 강력한 안티 디텍션 기능을 제공합니다.
Launch HN: Intuned (YC S22) – Build and run reliable browser automations as code↗intunedhq.com
- 347
AI API 호출 시 3.75배나 더 많은 비용을 지불하고 있었는데, 이렇게 발견했습니다.
개발팀이 AI 기능을 빠르게 출시하는 과정에서 부적절한 모델 선택으로 인해 API 비용이 과다 청구되는 문제를 발견하고, 이를 해결하기 위해 GitHub Action을 통한 비용 분석 자동화 도구를 개발했습니다. 이 도구는 PR 단계에서 모델 오용, 중복 호출, 프롬프트 캐싱 기회 등을 사전에 감지하여 비용 효율적인 AI 아키텍처 구축을 돕습니다.
We Were Paying 3.75x More Than Necessary on Every AI API Call — Here's How We Found It↗dev.to
- 349
화면 인지 AI 비서: 텍스트 기록만으로는 인터뷰의 맥락을 놓치는 이유
기존 AI 비서는 음성 기록(Transcript)에만 의존하여 사용자가 보고 있는 시각적 정보를 놓치는 한계가 있지만, 화면 인지 AI는 코드, 에러 메시지, 시스템 설계도 등 화면 내 컨텍스트를 직접 참조합니다. 이를 통해 AI는 단순한 요약을 넘어 구체적인 버그 수정이나 설계 분석 등 훨씬 정교하고 실질적인 도움을 제공할 수 있습니다.
Screen-Aware AI Assistant: Why Transcript-Only Interview Tools Miss Context↗dev.to
- 357
AI 에이전트 레드팀 운영을 위한 오픈소스 프레임워크 공개했습니다.
기존 LLM 평가 방식이 놓치기 쉬운 AI 에이전트 특유의 보안 위협인 프롬프트 인젝션과 권한 위반 등을 탐지하기 위한 오픈소스 프레임워크 AgentSafeLabs가 출시되었습니다. 이 도구는 OWASP 에이전트 보안 표준을 기반으로 에이전트의 동작을 테스트하고 구조화된 결과를 제공하여 에이전트 시스템의 신뢰성을 높이는 데 집중합니다.
I just published an open-source framework for red-teaming AI agents.↗dev.to
- 360
GPT-4o vs Claude 3.5 Sonnet vs Gemini 1.5 Pro: 실제 API 비용 비교 - 프로덕션 LLM 앱용
LLM API 비용은 단순히 입력 토큰 가격이 아닌, 출력 토큰의 양과 컨텍스트 크기에 따라 모델별로 극명한 차이를 보입니다. Claude 3.5 Sonnet은 높은 출력 비용으로 인해 챗봇 서비스에 불리하며, Gemini 1.5 Pro는 128K 토큰 이하에서 가장 경제적이지만 그 이상에서는 비용이 급증하는 구조를 가집니다.
GPT-4o vs Claude 3.5 Sonnet vs Gemini 1.5 Pro: real API cost comparison for production LLM apps↗dev.to












