오늘의 오픈 소스 프로젝트 (#90): turbovec – 1000만 개의 문서를 31GB에서 4GB로 줄이는 벡터 인덱스
(dev.to)
turbovec은 Google Research의 TurboQuant 알고리즘을 활용해 1,000만 개의 벡터 데이터를 31GB에서 4GB로 8배 압축하면서도 FAISS보다 빠른 검색 성능을 제공하여 RAG 인프라 비용 문제를 혁신적으로 해결하는 오픈소스 라이브러리입니다.
이 글의 핵심 포인트
- 11,000만 개 문서 기준 메모리 사용량을 31GB에서 4GB로 약 8배 압축 가능
- 2Google Research의 TurboQuant 알고리즘을 적용하여 FAISS 대비 검색 속도 12~20% 향상
- 3