AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
AI 모델 관련 글 — 3 페이지
- 1
Show HN: Needle: 26M 모델로 Gemini Tool Calling을 증류했습니다.
Needle는 Gemini 3.1을 증류(Distillation)하여 만든 26M 파라미터 규모의 초경량 모델로, 특정 기능(Tool Calling) 수행에 최적화되어 있습니다. 모바일, 워치, 스마트 글래스 등 온디바이스(On-device) 환경에서 압도적인 추론 속도와 효율성을 제공하며, 특정 태스크에서는 훨씬 큰 모델들보다 뛰어난 성능을 보여줍니다.
Show HN: Needle: We Distilled Gemini Tool Calling into a 26M Model↗github.com
- 4
Google의 'Create My Widget' 기능, AI와 API를 활용해 나만의 위젯을 만들 수 있게 될 거예요
구글이 사용자가 자연어로 자신만의 커스텀 위젯을 생성할 수 있는 안드로이드의 'Create My Widget' 기능을 발표했습니다. Gemini AI를 통해 웹 정보와 구글 앱(Gmail, 캘린더 등)의 데이터를 통합한 개인화된 대시보드를 구축할 수 있으며, 이번 여름 삼성 갤럭시와 구글 픽셀 기기에 우선 출시될 예정입니다.
Google’s ‘Create My Widget’ feature will let you vibe-code your own widgets↗techcrunch.com
- 6
Gemini의 최신 업데이트, 휴대폰 제어에 집중
구글이 프리미엄 안드로이드 기기를 위한 'Gemini Intelligence'를 발표하며, AI가 사용자를 대신해 앱을 조작하고 작업을 수행하는 '에이전트 AI' 시대를 본격화합니다. 이번 업데이트는 멀티모달 입력을 통한 작업 자동화, 자연어로 위젯을 생성하는 'Generative UI', 그리고 개인화된 자동 완성 기능 등을 핵심으로 합니다.
Gemini’s latest updates are all about controlling your phone↗theverge.com
- 10
아ంటీ 테스트: 몰약알람어를 사용하는 환자들이 모국어로 Health AI에게 질문할 때 무엇을 보게 되는가
대부분의 헬스케어 AI가 영어 중심의 번역 레이어에 의존하여 발생하는 정보 왜곡 문제를 지적하며, 인도 22개 언어에 대해 '네이티브 다국어 추론'을 구현한 GoDavaii의 사례를 소개합니다. 단순 번역을 넘어 사용자의 모국어 문맥과 언어 구조를 직접 이해하는 기술적 차별화가 글로벌 시장 공략의 핵심임을 강조합니다.
The Aunty Test - what Malayalam-speaking patients see when they ask Health AI in their own language↗dev.to
- 12
온톨로지, 보안, 자가 진화 기능을 갖춘 로컬 그래프-RAG 엔진 구축: 미니 Palantir (알파)
PROJECT JAMES는 보안과 온톨로지를 결합한 로컬 실행형 Graph-RAG 엔진으로, 데이터 유출 걱정 없이 개인이나 기업이 로컬 환경에서 강력한 지식 엔진을 구축할 수 있게 설계되었습니다. Ollama를 활용한 100% 로컬 구동, 3단계 보안 모델(RBAC, ABAC, 명령 격리), 그리고 자가 진화 기능을 통해 '미니 팔란티어(Mini Palantir)'를 지향합니다.
Building a Mini Palantir: A Local Graph-RAG Engine with Ontology, Security, and Self-Evolution (Alpha)↗dev.to
- 14
DeepSeek V4 + Claude Code: 중국 최고 수준의 오픈 소스 모델로 "수술적" 개발 워크플로우 구축
DeepSeek V4의 강력한 추론 능력과 Claude Code의 CLI 에이전트 기능을 결합하여, 저비용·고효율의 '수술적' 개발 워크플로우를 구축하는 방법을 제시합니다. 이는 단순한 프롬프트 입력을 넘어, AI가 직접 코드를 수정하고 테스트하며 Git을 관리하는 자동화된 개발 루프를 통해 1인 기업의 생산성을 극대화하는 데 초점을 맞춥니다.
DeepSeek V4 + Claude Code: Building a "Surgical" Development Workflow with China's Strongest Open-Source Model↗dev.to
- 18
Thinking Machines, AI가 말하는 동안 실제로 경청하는 AI 구축을 목표로
전 OpenAI CTO 미라 무라티가 설립한 'Thinking Machines Lab'이 사용자의 말을 끊거나 동시에 들을 수 있는 '인터랙션 모델(interaction models)'을 발표했습니다. 이 모델은 'Full Duplex' 기술을 통해 0.40초라는 인간의 대화 속도에 가까운 초저지연 응답을 구현하여, 기존의 텍스트 기반 주고받기 방식이 아닌 실제 전화 통화와 같은 실시간 상호작용을 목표로 합니다.
Thinking Machines wants to build an AI that actually listens while it talks↗techcrunch.com
- 22
단일 AMD MI300X에서 구축하는 오픈 소스 텍스트-30초 영화 리얼 파이프라인
단일 AMD MI300X GPU를 활용하여 텍스트 한 문장으로부터 30초 분량의 완성도 높은 영화급 영상을 생성하는 오픈 소스 파이프라인 기술입니다. 비전 크리틱(Vision Critic)이라는 자동 검수 루프를 도입하여 생성된 영상의 오류를 스스로 찾아내고 재렌더링함으로써, 단일 하드웨어 내에서 고품질의 멀티 모델 워크플로우를 구현했습니다.
Building an Open-Source Text-to-30s-Cinematic-Reel Pipeline on a Single AMD MI300X↗dev.to















