Zml-smi: 범용 GPU, TPU, NPU 모니터링 도구
(zml.ai)
zml-smi는 NVIDIA, AMD, Google TPU, AWS Trainium 등 다양한 AI 가속기(GPU, TPU, NPU)를 통합하여 실시간으로 진단하고 모니터링하는 범용 도구입니다. nvidia-smi와 nvtop의 장점을 결합하여 하드웨어 성능, 상태, 프로세스별 리소스 사용량까지 투명하게 제공합니다. 특히 샌드박스 방식으로 구동되어 최소한의 의존성만 필요하며, 최신 AMD GPU 지원을 위한 독자적인 기술적 해결책을 제시했습니다.
이 글의 핵심 포인트
- 1zml-smi는 GPU, TPU, NPU를 포함한 범용 AI 가속기 진단 및 모니터링 도구이다.
- 2NVIDIA, AMD, Google TPU, AWS Trainium 등 주요 AI 가속기 플랫폼을 통합 지원한다.
- 3