Netflix Tech Blog
원문 사이트 ↗Netflix Tech Blog는 Netflix 엔지니어링 팀이 운영하는 매체로, 대규모 마이크로서비스 설계, 스트리밍 인프라, 데이터 파이프라인, A/B 테스트 시스템 등 100M+ 사용자 서비스의 운영 노하우를 발행합니다. 한국 시니어 엔지니어에게 reference architecture 학습 자료로 추천합니다.
Netflix Tech Blog 주요 토픽
Netflix Tech Blog 관련 최신 글
- 0
넷플릭스 초기 연구 탐색: 더욱 제어 가능한 AI 비디오 편집으로 향하다
넷플릭스는 원본 영상을 보완하여 예고편, 티저, 소셜 미디어용 단편 영상 등 홍보 콘텐츠를 제작하는 기술을 개발하고 있습니다. 이번 연구의 핵심은 단순한 자동화를 넘어 창작자의 비전을 정확히 구현할 수 있는 '제어 가능한(controllable)' AI 편집 기술을 구축하는 것입니다.
Toward More Controllable AI Video Editing: An Early Research Exploration at Netflix↗netflixtechblog.com
- 9
Cassandra에서 시계열 작업 부하를 위한 넓은 파티션 동적 분할
넷플릭스는 시계열 데이터의 파티션이 비대해짐에 따라 발생하는 높은 테일 레이턴시와 시스템 부하 문제를 해결하기 위해 기존의 예측 기반 파티셔닝 방식의 한계를 분석했습니다. 이를 극복하고자 데이터 사용 패턴을 실시간으로 모니터링하여 파티션을 동적으로 재분할하는 자동화된 솔루션을 구축하여 시스템 안정성을 확보했습니다.
Dynamically Splitting Wide Partitions in Cassandra for Time Series Workloads↗netflixtechblog.com
- 12
사일로에서 서비스 토폴로지까지: 넷플릭스, 실시간 서비스 맵을 구축한 이유
넷플릭스는 분산된 마이크로서비스 환경에서 발생하는 장애를 빠르게 해결하기 위해 서비스 간의 실시간 연결 관계를 보여주는 '서비스 토폴로지 맵'을 구축했습니다. 기존의 메트릭, 로그, 트레이스만으로는 파악하기 어려운 서비스 간 의존성과 장애 영향 범위를 시각화하여 엔지니어의 대응 능력을 극대화하는 것이 핵심입니다.
From Silos to Service Topology: Why Netflix Built a Real-Time Service Map↗netflixtechblog.com
- 17
인간 인프라: Netflix, 대규모 라이브 운영을 위한 백층을 어떻게 구축했나
넷플릭스가 단순 VOD 서비스를 넘어 대규모 라이브 스트리밍 시대로 전환하며 구축한 '인간 인프라'와 운영 전략을 다룹니다. 기술적 자동화를 넘어, 실시간 방송의 불확실성을 제어하기 위해 구축된 방송 운영 센터(BOC)와 물리적/운영적 중복성 확보 과정을 상세히 설명합니다.
The Human Infrastructure: How Netflix Built the Operations Layer Behind Live at Scale↗netflixtechblog.com
- 19
같은 질문에 두 번 답하지 마세요: Netflix 규모의 Druid를 위한 Interval-Aware Caching
넷플릭스는 대규모 데이터 쿼리 부하를 해결하기 위해 Apache Druid의 롤링 윈도우 특성을 활용한 '인터벌 인식 캐싱(Interval-Aware Caching)' 기술을 도입했습니다. 변하지 않는 과거 데이터는 긴 TTL로 캐싱하고, 최신 데이터만 짧게 갱신함으로써 데이터의 미세한 지연(5초)을 허용하는 대신 인프라 비용과 쿼리 부하를 획기적으로 줄였습니다.
Stop Answering the Same Question Twice: Interval-Aware Caching for Druid at Netflix Scale↗netflixtechblog.com
- 21
대규모 라이브 스트리밍을 더 스마트하게: 모든 Netflix 라이브 이벤트에 VBR 도입
넷플릭스가 모든 라이브 스트리밍 인코딩 방식을 CBR(고정 비트레이트)에서 VBR(가변 비트레이트)로 전환했습니다. 이를 통해 평균 데이터 전송량을 15% 절감하고 버퍼링 발생률을 5% 낮추는 성과를 거두었으나, 트래픽 변동성 증가에 따른 인프라 관리의 복잡성이라는 과제를 안게 되었습니다.
Smarter Live Streaming at Scale: Rolling Out VBR for All Netflix Live Events↗netflixtechblog.com















