Cassandra에서 시계열 작업 부하를 위한 넓은 파티션 동적 분할
(netflixtechblog.com)
넷플릭스는 시계열 데이터 축적으로 발생하는 카산드라의 와이드 파티션 문제를 해결하기 위해, 예측 기반의 정적 파티셔닝을 넘어 데이터 사용 패턴에 따라 파티션을 동적으로 재분할하는 자동화된 기술적 접근법을 제시하며 대규모 데이터 운영의 효율성을 입증했습니다.
이 글의 핵심 포인트
- 1카산드라의 와이드 파티션 문제로 인해 읽기 지연 시간이 밀리초에서 초 단위로 급증하는 현상 발생
- 2기존의 Monte Carlo 시뮬레이션 기반 예측 파티셔닝은 워크로드 변화 및 데이터 아웃라이어 대응에 한계
- 3