AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 75 페이지
- 0
Show HN: LLM 운영을 위한 Bloomberg Terminal, 무료 오픈 소스 버전으로 출시
LLM 서비스의 가동률, 비용, 리스크를 통합 관리할 수 있는 오픈 소스 'LLM Ops Toolkit'이 출시되었습니다. 마치 금융 거래를 위한 블룸버그 터미널처럼, 18개 이상의 LLM 제공업체의 상태를 모니터링하고 비용 및 지연 시간을 시뮬레이션하여 운영의 불확실성을 제거하는 것을 목표로 합니다.
Show HN: Bloomberg Terminal for LLM ops – free and open source↗news.ycombinator.com
- 1
Show HN: 제가 Gemma 4 E2B를 벤치마크했습니다 – 2B 모델이 멀티턴에서 12B를 이겼습니다.
구글의 최신 소형 모델인 Gemma 4 E2B(2B)가 벤치마크 결과, 파라미터 수가 훨씬 많은 상위 모델들을 압도하는 놀라운 성능을 보여주었습니다. 특히 멀티턴 대화와 RAG 성능에서 세대 간의 비약적인 발전을 이루며, 소형 모델(SLM)의 효율성이 극대화되었음을 증명했습니다.
Show HN: I benchmarked Gemma 4 E2B – the 2B model beat the 12B on multi-turn↗aiexplr.com
- 8
Slash Local LLM Latency by 67%: Open-Source Magic (No Cloud Needed) Slash Local LLM Latency by 67%: 오픈소스 마법 (클라우드 불필요)
로컬 LLM의 응답 지연 시간을 67% 단축할 수 있는 오픈소스 최적화 전략을 소개합니다. Hugging Face의 기본 설정 대신 vLLM, llama.cpp, 4-bit 양자화 및 프롬프트 최적화를 활용하여 저사양 하드웨어에서도 고성능 추론 환경을 구축하는 방법을 제시합니다.
Slash Local LLM Latency by 67%: Open-Source Magic (No Cloud Needed)↗dev.to
- 9
OpenAI의 경쟁사 제압에 관한 최신 내부 메모 공개
OpenAI의 최고수익책임자(CRO) 데니스 드레서의 내부 메모를 통해, OpenAI가 단순한 모델 제공자를 넘어 기업용 'AI 플랫폼'으로 진화하려는 전략이 공개되었습니다. OpenAI는 Anthropic 등 경쟁사와의 격차를 벌리기 위해 제품 간 통합과 기업 워크플로우에 대한 깊은 침투를 통해 강력한 해자(Moat)를 구축하는 데 집중할 계획입니다.
Read OpenAI’s latest internal memo about beating the competition — including Anthropic↗theverge.com
- 11
Show HN: Rekal – LLM을 위한 장기 기억, 단일 SQLite 파일에 담기
Rekal은 Claude Code와 같은 LLM 에이전트에게 로컬 SQLite 파일을 활용해 장기 기억을 부여하는 MCP(Model Context Protocol) 서버입니다. 클라우드나 외부 API 키 없이도 키워드, 벡터, 최신성을 결합한 하이브리드 검색을 통해 개인화된 컨텍스트를 기기 내에서 안전하게 유지합니다.
Show HN: Rekal – Long-term memory for LLMs in a single SQLite file↗github.com
- 13
단일 이진 연산자를 통한 모든 초등 함수 구현
단일 이진 연산자 eml(x, y) = exp(x) - ln(y)를 사용하여 sin, cos, log 등 모든 초등 함수를 구현할 수 있는 새로운 수학적 프레임워크가 제안되었습니다. 이 방식은 수학적 표현식을 단순한 이진 트리 구조로 통일함으로써, 데이터로부터 정확한 수학 공식을 찾아내는 '심볼릭 회귀(Symbolic Regression)'를 미분 가능한 형태로 수행할 수 있게 합니다.
All elementary functions from a single binary operator↗arxiv.org
- 14
공간 브로드캐스트 디코더: VAE에서 분리된 표현 학습을 위한 간단한 아키텍처
이 글은 VAE(Variational Autoencoder)에서 객체의 위치, 크기, 회전 등 개별 특징을 효과적으로 분리하여 학습할 수 있는 '공간 브로드캐스트 디코더(SBD)' 아키텍처를 소개합니다. 복잡한 손실 함수 조정 없이도 구조적 혁신만으로 분리된 표현 학습(Disentangled Representation Learning)을 달성하는 방법을 다룹니다.
Spatial Broadcast Decoder: A Simple Architecture for Learning DisentangledRepresentations in VAEs↗dev.to
- 16
Anthropic이 AI Claude Mythos를 공개하며 충격적인 발표를 하다.
Anthropic이 보안상의 이유로 비공개로 유지해 온 초강력 AI 모델 'Claude Mythos Preview'의 존재를 드러냈습니다. 이 모델은 기존 공개 모델을 압도하는 해킹 및 취약점 발견 능력을 갖추고 있으며, 글로벌 빅테크들과 협력하여 인터넷 보안을 강화하는 'Project Glasswing'의 핵심 역할을 수행합니다.
Anthropic Just Dropped the Bomb on AI called Claude Mythos.↗dev.to















