AI가 발견한 취약점이 훈련 데이터의 메아리가 아닌지 확인하는 방법
(dev.to)
AI 보안 에이전트가 과거의 CVE를 단순 재현하는 '에코 현상'을 방지하기 위해 NVD 비교와 코드 익명화 분석을 포함한 3단계 검증 워크플로를 구축함으로써 AI가 발견한 취약점의 신규성을 증명하고 보안 솔루션의 기술적 신뢰도를 확보해야 합니다.
이 글의 핵심 포인트
- 1AI 보안 에이전트가 과거의 CVE를 새로운 취약점으로 오인하여 보고할 위험 존재
- 2원인은 LLM 학습 데이터(NVD, GitHub 등)에 이미 공개된 취약점 정보가 포함되어 있기 때문
- 3검증 방법 1: NVD JSON 피드를 활용하여 AI 발견 내용과 기존 CVE 간의 유사도(Fuzzy Match) 측정