AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 69 페이지
- 1
WebAssembly 기반 Apple Silicon에서 Zero-Copy GPU 추론 구현
Apple Silicon의 통합 메모리 구조(UMA)를 활용하여 WebAssembly(Wasm)의 선형 메모리를 GPU와 복사 없이(Zero-Copy) 직접 공유하는 기술적 구현 방법을 다룹니다. 이를 통해 Wasm을 제어 평면으로, GPU를 연동된 연산 평면으로 활용하여 데이터 직렬화 및 복사 오버헤드가 거의 없는 고성능 AI 추론 환경을 구축할 수 있습니다.
Zero-Copy GPU Inference from WebAssembly on Apple Silicon↗abacusnoir.com
- 2
브란스포드 전달: 개념과 Claude 출력 모두를 위한 루프 완성 테스트
이 기사는 '인식(Recognition)'과 '이해(Comprehension)'를 혼동하는 위험성을 지적하며, Bransford Transfer 테스트를 통해 인간의 학습과 AI 에이전트의 일반화 능력을 검증하는 방법을 제시합니다. 새로운 형태의 문제에서도 개념을 적용할 수 있는지 확인하는 것이 진정한 학습과 성능의 척도임을 강조합니다.
Bransford transfer: the loop-completion test for concepts AND for Claude outputs↗dev.to
- 3
F-VLM: 동결된 비전-언어 모델 기반의 개방형 어휘 객체 탐지
F-VLM은 대규모 비전-언어 모델(VLM)의 가중치를 고정(Frozen)한 상태에서 새로운 객체를 탐지할 수 있는 개방형 어휘 객체 탐지(Open-Vocabulary Object Detection) 기술입니다. 모델 전체를 재학습시키는 막대한 비용 없이도, 텍스트 설명만으로 학습 데이터에 없던 새로운 물체를 식별할 수 있는 효율적인 접근법을 제시합니다.
F-VLM: Open-Vocabulary Object Detection upon Frozen Vision and Language Models↗dev.to
- 7
Meshcore: 분산 P2P LLM 추론 네트워크를 위한 아키텍처
Meshcore는 고성능 LLM 추론을 위해 설계된 Web2.5 기반의 분산 P2P 컴퓨팅 프로토콜입니다. 중앙 집중식 제어 평면(Control Plane)과 탈중앙화된 데이터/연산 평면(Data Plane)을 결합하여, Apple Silicon과 같은 유휴 에지 하드웨어의 성능을 극대화하는 실용적인 DePIN 아키텍처를 제안합니다.
Meshcore: Architecture for a Decentralized P2P LLM Inference Network↗dev.to
- 9
Show HN: Rapid-MLX – Mac에서 로컬 LLM 실행, 대체 솔루션 대비 2~3배 빠른 속도
Rapid-MLX는 Apple Silicon Mac 환경에서 로컬 LLM을 기존 Ollama나 llama.cpp 대비 2~4배 빠른 속도로 실행할 수 있도록 최적화된 도구입니다. OpenAI 호환 API를 제공하여 Cursor, LangChain 등 기존 AI 에코시스템과 즉시 연동되며, 클라우드 비용 없이 고성능 AI 모델을 로컬에서 구동할 수 있게 합니다.
Show HN: Rapid-MLX – Run local LLMs on Mac, 2-3x faster than alternatives↗github.com
- 15
무료 100% AI 오픈 소스 모델을 모두 사용하고 있습니다.
2026년 오픈 소스 LLM의 비약적인 발전으로 인해, 고비용의 상용 API에 의존하지 않고도 거대 모델을 로컬 환경이나 자체 인프라에서 효율적으로 운영할 수 있는 시대가 열렸습니다. MoE(Mixture of Experts) 기술과 양자화 기술을 통해 Qwen, GLM, Gemma 등 최첨단 성능을 가진 모델들을 저비용으로 활용하여 강력한 AI 에이동(Agentic) 시스템을 구축할 수 있게 되었습니다.
I'm using all FREE 100% AI Open Source Models↗dev.to
- 18
Claude Opus 4.7 vs 4.6: 실제로 무엇이 바뀌었으며 마이그레이션으로 무엇이 망가지는가
Anthropic이 코딩과 에이전트 성능을 대폭 강화한 Claude Opus 4.7을 출시했습니다. 하지만 API 파라미터 변경과 토큰 효율 변화로 인해 기존 시스템에 400 에러를 유발할 수 있는 'Breaking Changes'가 포함되어 있어, 단순 교체가 아닌 정밀한 마이그레이션 전략이 필요합니다.
Claude Opus 4.7 vs 4.6: What Actually Changed and What Breaks on Migration↗dev.to
- 20
13시간 만에 6만 달러 청구: 유출된 Firebase 키가 AI 기반 앱을 망치는 이유
일본의 한 개발자가 Firebase와 Gemini API 키 유출로 인해 단 13시간 만에 약 6만 달러(약 8천만 원)의 비용을 청구받는 사고가 발생했습니다. 이는 AI가 생성한 코드가 기능 구현에만 집중하여 보안 설정을 간과할 수 있는 'AI 코딩 시대'의 치명적인 보안 취약점을 극명하게 보여줍니다.
$60K Billed in 13 Hours: Why Leaked Firebase Keys Keep Killing AI-Built Apps↗dev.to















