에이전트 메모리 권한을 점수 공식으로 바꾸려 했더니, 홀드아웃 테스트가 주장을 바꿔놓았다.
(dev.to)
AI 에이전트가 단순 텍스트 유사도를 넘어 정책적 권위와 범위를 기준으로 메모리를 검색하게 만드는 새로운 스코어링 모델의 설계와 실험적 검증 과정을 통해 에이전트의 행동 정확도를 높이는 방법론을 제시합니다.
이 글의 핵심 포인트
- 1단순 텍스트 유사도(BM25) 기반 검색이 권한 없는 정보를 선택하는 'Adversarial' 문제 지적
- 2권한, 범위, 구체성, 유효성 등을 반영한 다차원 스코어링 공식(Governance Score) 제안
- 3