폴트레이: 캐스케이드 장애 전파를 레이블 부착 전환 시스템으로 형식화한 이유
(dev.to)
FaultRay는 운영 중인 시스템에 직접적인 부하를 주지 않으면서도, 클라우드 인프라의 상관관계 있는 장애 전파(Cascade Failure)와 시스템의 이론적 가용성 상한선을 수학적으로 모델링하는 연구 프로토타입입니다. 기존 카오스 엔지니어링 도구의 운영 리스크와 전통적 신뢰성 모델의 독립성 가정 오류를 해결하는 데 집중합니다.
이 글의 핵심 포인트
- 1LTS(Labeled Transition System)를 활용하여 장애 전파 과정을 수학적으로 정형화
- 2상관관계가 있는 장애(Correlated Failure)를 모델링하여 기존 모델의 가용성 과대평가 문제 해결
- 3