Show HN: TurboQuant, vector search를 위한 2-4 bit compression
(github.com)
TurboQuant는 Rust 기반의 고속 벡터 양자화 라이브러리로, Python 바인딩을 제공하며 벡터를 차원당 2-4비트로 압축합니다. FAISS PQ와 달리 데이터에 독립적(data-oblivious)이어서 학습 단계나 코드북 재학습이 필요 없어 인덱스 생성과 인프라가 간소화됩니다. 근접한 왜곡률로 FAISS와 유사하거나 더 높은 재현율을 달성하며, 최대 16배의 압축률을 제공합니다.
이 글의 핵심 포인트
- 1TurboQuant는 Rust 기반으로 2-4비트 벡터 압축을 제공하며 Python 바인딩을 지원합니다.
- 2FAISS PQ와 달리 '데이터 독립적(data-oblivious)'으로 학습 과정이나 데이터 변경 시 코드북 재학습이 불필요합니다.
- 3