소형 언어 모델에게 기억시키는 방법: Differentiable Neural Computers를 활용한 LLM 노트북 제공
(dev.to)
소형 언어 모델(SLM)의 환각 현상을 해결하기 위해 DNC를 활용한 외부 메모리 구조를 제안하며, 이는 모델 재학습 없이도 지식 업데이트가 가능해 온디바이스 AI의 운영 비용을 낮추고 성능을 극대화할 수 있는 핵심 기술입니다.
이 글의 핵심 포인트
- 1SLM의 파라미터 부족으로 인한 사실 관계 망각 및 환각(Hallucination) 문제 해결
- 2DNC(Differentiable Neural Computer)를 활용하여 모델에 외부 메모리 행렬(Memory Matrix) 도입
- 3