SRE 채용: 100명 이상의 후보자 면접 후 제가 찾는 것
(dev.to)
SRE(Site Reliability Engineering) 채용 시 특정 도구나 자격증 같은 외적 스펙보다 시스템적 디버깅, 모호함에 대한 대처, 글쓰기, 자동화 마인드셋 등 근본적인 엔지니어링 역량을 검증해야 한다는 인사이트를 담고 있습니다. 100명 이상의 면접 경험을 바탕으로 실질적인 면접 구조와 피해야 할 레드 플적 요소를 제시합니다.
- 1특정 도구(Terraform, AWS 등)나 자격증보다 시스템의 근본 원리와 디버깅 역량이 채용의 핵심임
- 2장애 상황에서의 모호함을 다루는 능력과 논리적인 'Systematic Debugging' 프로세스 검증 필요
- 3SRE의 핵심 역량 중 하나로 명확한 상황 전달을 위한 '글쓰기 능력'과 '공감 능력' 강조
- 4자동화의 '방법'보다 '왜(Why)' 자동화하는지에 대한 ROI 관점의 사고방식 중시
- 5사람을 탓하거나(Blame), 단순 기술에만 매몰된 태도는 채용 시 피해야 할 레드 플래그
왜 중요한가
배경과 맥락
업계 영향
한국 시장 시사점
스타트업 창업자와 CTO에게 이 글은 '기술 부채'를 방지하는 인재 채점표를 제공합니다. 많은 리더가 특정 기술 스택을 다룰 줄 아는 사람을 찾으려 하지만, 이는 단기적인 해결책에 불과합니다. 진정한 가치는 장애 상황에서 논리적으로 원인을 파헤치고, 이를 문서화하여 팀 전체의 지식으로 전이시킬 수 있는 '시스템적 사고'를 가진 엔지니어에게서 나옵니다.
특히 '공감(Empathy)'과 '글쓰기(Writing)'를 SRE의 핵심 역량으로 꼽은 점에 주목해야 합니다. 엔지니어링 팀의 성장은 개별 기술의 우수성이 아니라, 장애 발생 시 얼마나 투명하게 소통하고(Post-mortem), 개발팀과 운영팀 사이의 신뢰를 유지하느냐에 달려 있습니다. 따라서 채용 프로세스 설계 시, 기술적 테스트뿐만 아니라 시나리오 기반의 커뮤니케이션 및 문서화 테스트를 포함하는 것이 장기적인 운영 안정성을 확보하는 강력한 실행 전략이 될 것입니다.
댓글
아직 댓글이 없습니다. 첫 댓글을 남겨보세요.