Kubernetes 환경에서의 Kafka: 디스크 I/O가 많은 데이터 서비스의 성능 교훈
(dev.to)
Kafka를 EC2에서 EKS로 이전할 때 발생하는 디스크 I/O 급증의 원인이 cgroup v2 등 리눅스 커널의 메모리 관리 방식 변화에 있음을 분석하며, 클라우드 네이티브 전환 시 인프라의 리소스 관리 메커니즘에 대한 심층적인 검증이 필수적임을 강조합니다.
이 글의 핵심 포인트
- 1EC2에서 EKS(Strimzi)로 Kafka 이전 시 예상치 못한 디스크 읽기 및 지연 시간 발생
- 2초기 가설인 '컨슈머 랙(Consumer Lag)'은 문제의 근본 원인이 아님이 확인됨
- 3