AI 에이전트 뉴스
Claude, Cursor, OpenClaw, ChatGPT Agent 등 자율적으로 작업을 수행하는 AI 에이전트 동향과 활용 사례.
총 3,250건·최신 업데이트
- 922
모두가 실시간으로 AI 보안을 헤쳐나가고 있다 - 구글도 마찬가지다
구글 클라우드 COO는 AI 보안이 사후 조치가 아닌 데이터 및 AI 전략과 결합된 플랫폼 접근 방식으로 다뤄져야 한다고 강조하며, 에이전트 기반의 새로운 공격 위협에 대응하기 위해 AI 기반의 자동화된 방어 체계가 필요하다고 주장합니다. 동시에 최근 구글 API 권한 확대 과정에서 발생한 대규모 과금 사고를 통해 클라우드 보안 및 비용 관리의 위험성을 조명합니다.
Everyone is navigating AI security in real time — even Google↗techcrunch.com
- 923
Show HN: Kanban CLI (로컬 우선, 에이전트 기반 터미널 작업 관리자)
Kanban CLI는 Rust로 작성된 로컬 우선(Local-first) 프로젝트 관리 도구로, 개발자뿐만 아니라 AI 에이전트가 작업을 수행하기 용이하도록 설계되었습니다. Git 통합 및 JSON 기반 아키텍처를 통해 태스크, 스프린트, 역할 관리를 터미널 환경에서 효율적으로 수행할 수 있게 돕습니다.
Show HN: Kanban CLI (A local-first, agent-first task manager for the terminal)↗codeberg.org
- 924
Show HN: 구독 토큰 에이전트로 검증된 SWE-벤치에서 97% 달성
이 프로젝트는 'recon(진단)', 'craft(구현)', 'audit(검증)'의 세 단계로 구성된 에이전트 파이프라인을 통해 SWE-bench Verified 테스트에서 97%라는 놀라운 성과를 달성했습니다. 단순한 LLM의 지능에 의존하기보다, 오류를 재현하고 패치를 생성한 뒤 전체 테스트 스위트를 통해 검증하는 체계적인 워크플로우를 통해 소프트웨어 버그 수정의 자동화 가능성을 입증했습니다.
Show HN: 97% on SWE-bench Verified with subscription-token agents↗github.com
- 925
제약 소멸: 백엔드 코드 생성 시 LLM 에이전트의 취약성
본 연구는 LLM 에이전트가 백엔드 개발 시 복잡한 구조적 제약을 다루는 능력을 평가하였으며, 제약 조건이 늘어날수록 에이전트의 성능이 급격히 하락하는 '제약 소멸' 현상을 입증했습니다. 특히 Django나 FastAPI처럼 컨벤션이 강한 프레임워크에서 성능 저하가 두드러지며, 주로 데이터 레이어에서의 오류가 주요 원인으로 나타났습니다.
Constraint Decay: The Fragility of LLM Agents in Back End Code Generation↗arxiv.org
- 926
트랩도어 공급망 공격, npm, PyPI, Crates.io에 타격 — AI 설정 파일 악용
TrapDoor 공격은 npm, PyPI, Crates.io에 34개의 악성 패키지를 배포하고, 오픈소스 저장소의 CLAUDE.md 및 .cursorrules 파일을 오염시켜 AI 코딩 어시스턴트를 무기화했습니다. 이 공격은 AI 에이전트가 프로젝트 내 설정 파일을 신뢰한다는 점을 악용하여 개발자의 클라우드 자격 증명과 개인 키를 탈취하는 것을 목표로 합니다.
TrapDoor supply-chain attack hits npm, PyPI, Crates.io — weaponizes AI config files↗dev.to
- 927
AI 생성 PR 통합 전 감사하세요 (Swarm Orchestrator 10.3.0)
Swarm Orchestrator는 Cursor나 Devin 같은 AI 코딩 에이전트가 제출한 PR에서 발견되는 'silent catch'나 'hallucinated mock' 같은 패턴을 탐지하는 오픈소스 감사 도구입니다. 최신 버전은 LLM 판사 기능을 도입하고 AI-BOM 생성을 지원하여, AI 에이전트 활용이 늘어나는 개발 환경에서 코드 신뢰성을 높이는 데 집중하고 있습니다.
Audit AI-Generated PRs Before You Merge Them (Swarm Orchestrator 10.3.0)↗dev.to
- 934
클라우드플레어 에이전트 준비도 점수, 알아야 할 모든 것
클라우드플레어는 웹사이트가 AI 에이전트에게 얼마나 잘 읽히는지 측정하는 'isitagentready.com' 스캐너를 공개했습니다. 이 도구는 발견 가능성, 콘텐츠 구조, 봇 제어 등 5개 카테고리의 16개 항목을 검사하여 점수를 제공하며, 에이전트가 스스로 웹사이트를 감사할 수 있는 MCP 엔드포인트 기능도 포함합니다.
All You Need To Know About Cloudflare’s Agent Readiness Score via @sejournal, @slobodanmanic↗searchenginejournal.com
- 936
Subham의 보안 에이전트 설계: Node.js & WebSockets 기반 실시간 클라우드 프린팅
인도 프린트샵의 개인정보 유출 문제를 해결하기 위해 개발된 Subhams Secure Agent는 Socket.io를 이용한 실시간 데이터 전송과 RAM 전용 프로세싱 기술을 도입했습니다. 이 시스템은 파일을 디스크에 저장하지 않고 메모리 내에서만 처리하여 출력 후 데이터를 즉시 삭제함으로써 보안성을 극대화했습니다.
Architecting Subhams Secure Agent: Real-Time Cloud Printing with Node.js & WebSockets↗dev.to
- 937
AI 에이전트 트랜잭션 보안 등급 4단계: INSTANT부터 APPROVAL까지
AI 에이전트가 DeFi 환경에서 자산을 안전하게 운용할 수 있도록 거래 규모와 위험도에 따라 4단계(INSTANT, NOTIFY, DELAY, APPROVAL) 보안 계층을 제공하는 WAIaaS의 기술을 소개합니다. 화이트리스트 기반의 'Default-Deny' 정책을 통해 에이전트의 치명적인 보안 취약점을 해결하는 데 집중합니다.
4 Security Tiers for AI Agent Transactions: INSTANT to APPROVAL↗dev.to
- 938
프롬프트 엔지니어링 중단: Eval 우선 방식이 25개의 알고리즘 버전을 자율적으로 출시하도록 도운 방법
에이전트 기반 개발에서 발생하는 알고리즘 성능 퇴보 문제를 해결하기 위해, 테스트 세트와 평가 루브릭을 갖춘 'AI 하네스' 구축의 중요성을 강조합니다. 이를 통해 비개발자도 AI 에이전트를 활용해 13일 만에 25개의 알고리즘 버전을 성공적으로 출시할 수 있었습니다.
Stop Engineering Prompts: How an Eval-First Harness Let Us Ship 25 Algorithm Versions Autonomously↗dev.to
- 939
내 에이전트는 드롭다운 메뉴를 볼 수 있었지만, 아무것도 선택할 수 없었어.
Safari MCP 개발자가 AI 에이전트가 드롭다운 메뉴를 찾지 못하는 버그를 해결한 과정을 다룹니다. 원인은 click 도구와 달리 select_option 도구가 iframe 및 Shadow DOM 내부를 탐색하지 못하는 단순 쿼리 방식을 사용했기 때문이며, 이를 통합된 깊은 탐색(deep walker) 로직으로 수정하여 해결했습니다.
My agent could see the dropdown. It just couldn't pick anything.↗dev.to
- 940
AI 에이전트를 위한 Lighthouse 구축: 단일 명령어, 12-벡터 보안 감사
AI 에이전트의 보안 검증 부재 문제를 해결하기 위해 개발된 ultraprobe는 별도의 API 키나 설치 없이 단일 명령어로 프롬프트의 보안성을 12개 벡터로 정밀 분석합니다. 이 도구는 프롬프트 인젝션, 데이터 유출, PII 탐지뿐만 아니라 URL의 AEO(답변 엔진 최적화) 성능까지 측정할 수 있는 통합 보안 솔루션을 지향합니다.
We Built Lighthouse for AI Agents — One Command, 12-Vector Security Audit↗dev.to






