같은 질문에 두 번 답하지 마세요: Netflix 규모의 Druid를 위한 Interval-Aware Caching
(netflixtechblog.com)
넷플릭스는 대규모 데이터 쿼리 부하를 해결하기 위해 Apache Druid의 롤링 윈도우 특성을 활용한 '인터벌 인식 캐싱(Interval-Aware Caching)' 기술을 도입했습니다. 변하지 않는 과거 데이터는 긴 TTL로 캐싱하고, 최신 데이터만 짧게 갱신함으로써 데이터의 미세한 지연(5초)을 허용하는 대신 인프라 비용과 쿼리 부하를 획기적으로 줄였습니다.
이 글의 핵심 포인트
- 1넷플릭스 데이터 규모: 10조 개 이상의 로우 및 초당 1,500만 개 이벤트 처리
- 2문제점: 롤링 윈도우 대시보드로 인한 중복 쿼리 폭증 (대시보드 1개당 최대 64개 쿼리 발생)
- 3