Lucene 베이지안 점수 쿼리 개수 최적화
(dev.to)Apache Lucene의 BayesianScoreQuery에 count() 메서드를 추가하여 검색 엔진의 문서 카운팅 성능을 최적화하고, 불필요한 데이터 매테리얼라이제이션을 방지함으로써 대규모 검색 서비스의 쿼리 지연 시간을 단축하는 기술적 진보를 다룹니다.
이 글의 핵심 포인트
- 1Apache Lucene의 BayesianScoreQuery에 count() 메서드 구현 추가
- 2문서 전체를 매테리얼라이즈하지 않고 개수만 빠르게 계산하여 쿼리 지연 시간 단축
- 3Elasticsearch, OpenSearch 등 Lucene 기반 검색 엔진의 성능 및 처리량 향상 기대