AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
AI 모델 관련 글 — 7 페이지
- 3
모델 점유율: 2026년에 Domain Authority를 대체할 지표
기존의 SEO 지표인 도메인 권위(Domain Authority)가 AI 검색 시대의 핵심 지표인 '모델 점유율(Share of Model, SoM)'로 대체되고 있습니다. SoM은 사용자의 질문에 대해 ChatGPT, Perplexity 등 AI 모델이 특정 브랜드를 추천할 확률을 의미하며, 이제는 클릭을 유도하는 것이 아닌 AI의 답변에 포함되는 것이 생존의 핵심입니다.
Share of Model: The Metric That Replaces Domain Authority in 2026↗dev.to
- 11
LLM이 TLA+로 현실 세계 시스템을 모델링할 수 있을까?
LLM이 TLA+와 같은 형식 검증 언어를 사용하여 실제 분산 시스템의 구현체를 정확히 모델링할 수 있는지 평가하는 'SysMoBench' 벤치마нк의 연구 결과를 다룹니다. 연구 결과, LLM은 문법이나 실행 단계는 통과하지만, 실제 코드의 로직을 반영하는 일치성(Conformance)과 불변성(Invariant) 테스트에서는 40%대의 낮은 점수를 기록하며 '교과서적 재현'에 그치는 한계를 보였습니다.
Can LLMs model real-world systems in TLA+?↗sigops.org
- 14
DeepSeek V4 Pro vs Flash: 3가지 작업, 1억 토큰, 실제 비용-품질 균형
DeepSeek V4 Pro와 Flash 모델의 비용 대비 성능을 분석하여, 작업 유형에 따른 최적의 모델 선택 전략을 제시합니다. 단순 코드 생성에는 저렴한 Flash가 유리하지만, 복지잡한 리팩토링에는 Pro가 필수적이며, '태스크 라우팅'을 통해 AI 운영 비용을 최대 80%까지 절감할 수 있음을 강조합니다.
DeepSeek V4 Pro vs Flash: 3 Tasks, 100M Tokens, Real Cost-Quality Tradeoff↗dev.to
- 17
키위찬, 클라우드에서 벗어나다: Qwen 35B, 완전 로컬 환경으로 전환하며 마인크래프트 역사에 족적을 남기다
마인크rypt AI 에이전트 '키위찬(Kiwi-chan)'이 클라우드 API 의존에서 벗어나 로컬 GPU 클러스터에 Qwen 35B 모델을 구축하며 완전한 로컬 환경으로 전환했습니다. 이를 통해 지연 시간(Latency)과 비용 문제를 해결함과 동시에, 엄격한 규칙 기반의 에러 복구 시스템을 구축하여 43.7%라는 유의미한 자율 수행 성공률을 기록했습니다.
KIWI-CHAN SEVERS THE CLOUD TETHER: QWEN 35B GOES FULLY LOCAL AND CHISELS HER WAY INTO MINECRAFT HISTORY↗dev.to
- 19
Show HN: 초고압축 – 수학적으로 손실 없는 5비트 LLM 압축 기술
UltraCompress는 단일 32GB 소비자용 GPU만으로 405B 규모의 초거대 언어 모델(LLM)을 성능 저하를 최소화하며 5비트로 압축할 수 있는 혁신적인 기술입니다. 레이어별 스트리밍 방식과 저차원 보정(V18-C) 기법을 통해 대규모 모델의 경량화 및 배포 비용을 획기적으로 낮출 수 있습니다.
Show HN: UltraCompress – first mathematically lossless 5-bit LLM compression↗github.com
- 21
SYNAPSE Route에서 세 모델 파이프라인을 보세요 – 커넥터 코드 불필요.
SYNAPSE는 모델 간의 복잡한 연결 코드(connector code) 없이도 다중 모델 파이프라인을 운영할 수 있는 기술을 선보였습니다. 표준화된 중간 표현(Canonical IR)과 어댑터(Adapter)를 활용해 모델의 스키마 변경이 전체 시스템에 미치는 영향을 최소화하고, 자동화된 감사 추적(Provenance chain)을 제공합니다.
See SYNAPSE Route a Three-Model Pipeline — No Connector Code Required.↗dev.to
- 22
Mitiga Labs: MCP 하이재킹 공격으로 Claude 코드 OAuth 토큰 유출, 은밀한 중간자 공격 방식 사용
Claude Code의 MCP(Model Context Protocol) 인프라를 겨냥하여 OAuth 토큰을 탈취하는 은밀한 중간자 공격(MITM) 방식이 발견되었습니다. 공격자는 악성 npm 패키지를 통해 사용자의 설정 파일을 변조하고 보안 경고를 무력화하여, 연결된 모든 SaaS 도구에 대한 접근 권한을 탈취할 수 있습니다.
Mitiga Labs: MCP Hijack Attack Steals Claude Code OAuth Tokens via Silent Man-in-the-Middle↗dev.to
















