14배 빠른 임베딩: Manticore에서 ONNX 경로를 재구축한 방법
(manticoresearch.com)Manticore Search가 기존 Candle 기반 엔진을 ONNX Runtime으로 재구축하여 임베딩 속도를 평균 14배 향상시킴으로써, 벡터 데이터베이스의 대규모 데이터 인제스트(Ingest) 성능과 효율성을 혁신적으로 개선했습니다.
이 글의 핵심 포인트
- 1Manticore Search 27.1.5 버전에서 새로운 ONNX Runtime 백엔드 출시
- 2기존 SentenceTransformers/Candle 경로 대비 평균 약 14배 빠른 임베딩 속도 달성
- 3단일 클라이언트 스레드 및 배치 사이즈 64 설정 시 최대 233 docs/sec 기록