AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 43 페이지
- 0
DeepSeek V4 Pro vs Flash: 3가지 작업, 1억 토큰, 실제 비용-품질 균형
DeepSeek V4 Pro와 Flash 모델의 비용 대비 성능을 분석하여, 작업 유형에 따른 최적의 모델 선택 전략을 제시합니다. 단순 코드 생성에는 저렴한 Flash가 유리하지만, 복지잡한 리팩토링에는 Pro가 필수적이며, '태스크 라우팅'을 통해 AI 운영 비용을 최대 80%까지 절감할 수 있음을 강조합니다.
DeepSeek V4 Pro vs Flash: 3 Tasks, 100M Tokens, Real Cost-Quality Tradeoff↗dev.to
- 3
키위찬, 클라우드에서 벗어나다: Qwen 35B, 완전 로컬 환경으로 전환하며 마인크래프트 역사에 족적을 남기다
마인크rypt AI 에이전트 '키위찬(Kiwi-chan)'이 클라우드 API 의존에서 벗어나 로컬 GPU 클러스터에 Qwen 35B 모델을 구축하며 완전한 로컬 환경으로 전환했습니다. 이를 통해 지연 시간(Latency)과 비용 문제를 해결함과 동시에, 엄격한 규칙 기반의 에러 복구 시스템을 구축하여 43.7%라는 유의미한 자율 수행 성공률을 기록했습니다.
KIWI-CHAN SEVERS THE CLOUD TETHER: QWEN 35B GOES FULLY LOCAL AND CHISELS HER WAY INTO MINECRAFT HISTORY↗dev.to
- 5
Show HN: 초고압축 – 수학적으로 손실 없는 5비트 LLM 압축 기술
UltraCompress는 단일 32GB 소비자용 GPU만으로 405B 규모의 초거대 언어 모델(LLM)을 성능 저하를 최소화하며 5비트로 압축할 수 있는 혁신적인 기술입니다. 레이어별 스트리밍 방식과 저차원 보정(V18-C) 기법을 통해 대규모 모델의 경량화 및 배포 비용을 획기적으로 낮출 수 있습니다.
Show HN: UltraCompress – first mathematically lossless 5-bit LLM compression↗github.com
- 7
SYNAPSE Route에서 세 모델 파이프라인을 보세요 – 커넥터 코드 불필요.
SYNAPSE는 모델 간의 복잡한 연결 코드(connector code) 없이도 다중 모델 파이프라인을 운영할 수 있는 기술을 선보였습니다. 표준화된 중간 표현(Canonical IR)과 어댑터(Adapter)를 활용해 모델의 스키마 변경이 전체 시스템에 미치는 영향을 최소화하고, 자동화된 감사 추적(Provenance chain)을 제공합니다.
See SYNAPSE Route a Three-Model Pipeline — No Connector Code Required.↗dev.to
- 8
Mitiga Labs: MCP 하이재킹 공격으로 Claude 코드 OAuth 토큰 유출, 은밀한 중간자 공격 방식 사용
Claude Code의 MCP(Model Context Protocol) 인프라를 겨냥하여 OAuth 토큰을 탈취하는 은밀한 중간자 공격(MITM) 방식이 발견되었습니다. 공격자는 악성 npm 패키지를 통해 사용자의 설정 파일을 변조하고 보안 경고를 무력화하여, 연결된 모든 SaaS 도구에 대한 접근 권한을 탈취할 수 있습니다.
Mitiga Labs: MCP Hijack Attack Steals Claude Code OAuth Tokens via Silent Man-in-the-Middle↗dev.to
- 12
Chrome의 4GB AI 모델은 새로운 것이 아니지만, 혼란스러워하는 것은 당연합니다.
구글 크롬이 사용자에게 명확한 사전 고지 없이 4GB 규모의 Gemini Nano AI 모델을 다운로드하여 저장 공간을 점유하면서 사용자 혼란을 야기하고 있습니다. 이는 구글의 'AI 기본값(AI as default)' 전략의 일환이지만, 최근 설정 문구 변경으로 인해 온디바이스 AI의 데이터 프라이버시 신뢰도까지 흔들리고 있는 상황입니다.
Chrome's 4GB AI model isn't new, but you're not wrong for being confused↗arstechnica.com
- 20
ChatGPT에서 Claude로 전환해도 맥락을 잃지 않는 방법
AI 모델(ChatGPT, Claude 등)을 전환할 때 발생하는 '맥락 상실(Context Amnesia)' 문제를 해결하기 위해, 채팅 UI와 메모리를 분리하여 독립적인 '컨텍스트 레이어'를 구축하는 방법론을 제시합니다. MemoryLake와 같은 도구를 활용해 파일과 데이터를 모델에 종속되지 않는 인프라로 관리함으로써 업무의 연속성을 확보하는 것이 핵심입니다.
How to Switch from ChatGPT to Claude Without Losing Your Context↗dev.to
- 22
스코어부터 워크플로우까지: STEM BIO-AI를 로컬 감사 시스템으로 전환하다
본 기사는 STEM BIO-AI 감사 도구가 단순한 신뢰도 점수 산출(Scoring)을 넘어, 개발자 워크플로우에 통합 가능한 '운영 중심의 시스템'으로 진화하는 과정을 다룹니다. 핵심은 복잡한 데이터를 하나의 점수로 통합하지 않고, 구조적 점수, 진단, 규제 추적성, AI 자문을 별도의 '레인(Lane)'으로 분리하여 운영의 명확성과 신뢰도를 높이는 아키텍처의 전환입니다.
From Score to Workflow: Turning STEM BIO-AI Into a Local Audit System↗dev.to















