장시간 스크레이퍼에서 발견된 세 가지 메모리 누수 패턴 (그리고 968번의 Trustpilot 실행 후 제가 어떻게 잡았는지)
(dev.to)
장시간 실행되는 스크레이퍼의 메모리 누수는 즉각적인 시스템 중단 대신 클라우드 비용을 급증시키므로, 비제한적 큐 사용과 객체 참조 유지를 방지하는 최적화 전략이 필수적입니다.
이 글의 핵심 포인트
- 1비제한적 asyncio 큐 사용 시 데이터 증가량에 따라 메모리가 선형적으로 증가하여 비용 상승 유발
- 2URL마다 동적으로 정규표현식을 생성하면 Python의 regex 캐시를 우회하여 메모리 누수 발생
- 3