Show GN: ArachneControl – 서버가 브라우저를 원격 제어해 수집하는 오픈소스 데이터 수집 시스템
(news.hada.io)ArachneControl은 서버가 사용자의 실제 브라우저 세션을 원격 제어하여 로그인 장벽과 차단을 우회하며 데이터를 수집하는 오픈소스 시스템으로, 크롤링 로직의 동적 변경과 효율적인 데이터 추출을 가능하게 합니다.
이 글의 핵심 포인트
- 1사용자의 실제 브라우저 세션을 활용하여 로그인 벽과 봇 차단을 우회하는 Zero-Footprint 방식 채택
- 2서버가 클라이언트에 수집 규칙(셀렉터, 액션 등)을 동적으로 발행하여 클라이언트 재배포 없이 로직 변경 가능
- 3WebUI를 통한 클릭 기반의 데이터 추출 레시피 작성 및 자동화 기능 제공