DeepSeek V4 공개: 1.6T 파라미터, 1M 컨텍스트, 그리고 기록적인 가격
(dev.to)
DeepSeek가 1.6T 파라미터의 DeepSeek V4를 공개하며 혁신적 압축 기술로 추론 비용을 70% 이상 절감함으로써, AI 산업의 패러다임을 모델 크기에서 효율성과 초장문 컨텍스트 이해 중심으로 전환하는 이정표를 제시했습니다.
이 글의 핵심 포인트
- 1DeepSeek-V4-Pro(1.6T 파라미터) 및 Flash(284B) 모델 출시 및 1M 토큰 컨텍스트 지원
- 2하이브리드 어텐션(CSA, HCA) 도입으로 추론 연산량 27%, KV 캐시 VRAM 사용량 10%로 절감
- 3