OpenTelemetry Collector를 활용한 쿠버네티스 클러스터 모니터링: 에이전트 + 게이트웨이 패턴 해설
(dev.to)
대규모 쿠버네티스 클러스터에서 발생하는 gRPC 연결 폭증과 데이터 유실 문제를 해결하기 위해, OpenTelemetry Collector를 경량 에이전트와 중앙 집중형 게이트웨이로 분리하여 운영하는 '에이전트+게이트웨이' 패턴의 핵심 설계 전략을 분석합니다.
이 글의 핵심 포인트
- 1모든 포드가 백엔드에 직접 gRPC 연결을 생성하면 커넥션 한계로 인해 RESOURCE_EXHAUSTED 에러 및 데이터 유실 발생
- 2DaemonSet(에이전트) 하나가 수집과 배치를 동시에 수행할 경우 리소스 경합으로 인한 OOMKilled 위험 존재
- 3