32개의 티켓, 7개의 스토리, YouTube 비디오 1개: Building Agent가 스프린트 11에서 실제로 무엇을 했는가?
(dev.to)이 글은 스프린트 10에서 모든 테스트를 통과했지만 실제 기능 검증이 부족했던 상황을 반성하며, 스프린트 11에서 '빌딩 에이전트'가 직접 코드를 작성하고 시스템을 운영하며 발견한 수많은 버그와 이를 해결하여 실제 작동하는 기능을 구현한 과정을 상세히 기록합니다. 특히 YouTube 비디오 업로드와 AI 기반 팟캐스트 생성 등 복잡한 엔드투엔드 시나리오를 성공적으로 구현한 경험을 통해 이론적 테스트와 실제 시스템 작동 간의 괴리를 극복하는 중요성을 강조합니다.
- 1스프린트 10은 5,575개의 테스트를 통과했지만, 실제 인간이 볼 수 있는 기능은 없었다.
- 2스프린트 11은 라이브 서버 HTTP 요청, 브라우저 상호작용, 실제 파일 출력 또는 외부 API 호출을 통한 '실제 증명'을 목표로 했다.
- 3빌딩 에이전트는 30분마다 버그를 발견하고 수정했으며, Dockerfile 오류, 인증 미들웨어 충돌, 39개의 잘못된 import 경로 등 다양한 인프라 버그를 해결했다.
- 4가장 복잡한 성과는 16단계에 걸쳐 Google Cloud, 브라우저, Docker, YouTube API를 사용하여 실제 YouTube 비디오를 업로드한 것이다 (링크: https://www.youtube.com/watch?v=XmOsrtWdRXg).
- 5Piper TTS를 Docker 내에서 실행하고 FFmpeg으로 조립하여 35.91초 길이의 AI 내레이션 팟캐스트 에피소드(episode-sprint11.wav)를 생성했으며, 추론 속도는 실시간보다 9.3배 빨랐다.
왜 중요한가
배경과 맥락
업계 영향
한국 시장 시사점
이 글은 모든 스타트업 창업자들이 개발 프로세스에서 반드시 새겨들어야 할 날카로운 교훈을 담고 있습니다. '테스트 통과'라는 숫자적 지표에 안주하는 순간, 실제 사용자에게는 전혀 작동하지 않는 '유령 기능'을 만들고 있을지도 모른다는 경고입니다. 특히, 인프라, 외부 연동, 환경 설정 등 프로덕션 레벨에서만 드러나는 문제는 초기 단계에서 빠르게 해결하지 않으면 향후 막대한 기술 부채와 서비스 중단으로 이어질 수 있습니다. 개발팀에 '빌딩 에이전트'와 같이 직접 배포하고 사용자의 입장에서 모든 기능을 검증하는 역할을 부여하는 것은 단순한 QA 인력 충원을 넘어, 개발 문화와 프로세스 자체를 혁신하는 기회가 될 것입니다.
댓글
아직 댓글이 없습니다. 첫 댓글을 남겨보세요.