우리가 연방준비제도 벤치마크를 능가하는 제재 심사 API를 구축한 방법
(dev.to)
Verifex는 기존 제재 스크리닝 도구의 고질적인 문제인 높은 오탐률(90-95%)을 해결하기 위해, 미 연준(Fed)의 GPT-4o 기반 벤치마크(98.9LL% F1)를 뛰어넘는 100% 정확도를 달성했습니다. 9가지 페널티 레이어와 하이브리드 매칭 파이프라인을 결합하여 다국어 및 복잡한 변형 패턴을 정밀하게 탐지하는 기술적 혁신을 보여주었습니다.
이 글의 핵심 포인트
- 1미 연준(Fed)의 GPT-4o 기반 벤치마크(98.95% F1)를 넘어 100% F1/Recall/Precision 달성
- 29가지 페널티 레이어를 통한 정교한 오탐 패턴(부모 이름 변형, 부분 일치 함정 등) 차단
- 3