실험 시작 전에 ML 정확도 주장을 해시하는 CLI를 만들었습니다.
(dev.to)
ML 모델의 성능 지표를 실험 전 해싱하여 데이터나 기준의 사후 조작을 방지하는 CLI 도구 'falsify'를 개발함으로써, 실험의 재현성을 보장하고 모델 성능 수치에 대한 기술적 신뢰성을 강화하는 방안을 제안합니다.
이 글의 핵심 포인트
- 1실험 전 지표, 임계값, 데이터셋 해시를 고정하여 사후 조작을 방지하는 'falsify' CLI 개발
- 2YAML 정규화(Canonicalization)를 통해 키 순서, 공백, 유니코드 차이로 인한 해시 불일치 문제 해결
- 3