AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 27 페이지
- 1
카글 GPU에서 사용 가능한 무료 35B 멀티모달 LLM 서버 — 모든 OpenAI 호환 클라이언트에서 접근 가능
이 글은 Kaggle의 무료 T4 GPU를 활용하여 Qwen3.6-35B 모델을 안정적인 API 서버로 구축하는 구체적인 아키텍처를 설명합니다. llama.cpp와 Cloudflare Quick Tunnel을 결과하여 세션 만료와 연결 끊김 문제를 해결하고, 모델과 바이너리를 Kaggle 데이터셋으로 관리하여 효율성을 극대화하는 노하우를 담고 있습니다.
Free 35B Multimodal LLM Server on Kaggle GPU — Accessible from Any OpenAI-Compatible Client↗dev.to
- 2
두 개의 AI 기반 과학 어시스턴트, 약물 재창출 업무에서 성공
구글과 FutureHouse가 개발한 새로운 AI 에이전트들이 방대한 생물학적 데이터를 분석하여 기존 약물을 새로운 질병 치료에 활용할 수 있는 가설을 성공적으로 제안했습니다. 이 시스템들은 인간 과학자를 대체하는 것이 아니라, 파편화된 연구 결과 사이의 숨겨진 연결고리를 찾아내어 과학적 발견의 효율성을 극대화하는 데 초점을 맞추고 있습니다.
Two AI-based science assistants succeed with drug-retargeting tasks↗arstechnica.com
- 3
Google의 SynthID AI 워터마킹 기술, OpenAI, Nvidia 등에서 채택
구글의 SynthID 기술이 구글 자체 모델을 넘어 OpenAI, Nvidia, 카카오, ElevenLabs 등 주요 AI 기업들의 시스템으로 확대 적용됩니다. 이 기술은 이미지의 픽셀이나 오디오의 파형에 워터마크를 직접 심어, 압축이나 편집 후에도 AI 생성 여부를 식별할 수 있는 강력한 내성을 제공합니다.
Google's SynthID AI watermarking tech is being adopted by OpenAI, Nvidia, and more↗arstechnica.com
- 7
제미니 3.5 플래시로 구글, 챗봇 대신 에이전트에 미래 AI 역량 집중
구글은 코딩과 자율 에이전트 작업에 최적화된 새로운 AI 모델인 제미니 3.5 플래시를 발표하며, 챗봇 중심에서 에이전트 중심으로의 기술적 전환을 선언했습니다. 이 모델은 기존 모델 대비 최대 12배 빠른 속도를 제공하며, 상위 모델인 3.5 프로와 협업하여 복잡한 워크플로우를 자율적으로 수행하는 에이전트 생태계를 구축합니다.
With Gemini 3.5 Flash, Google bets its next AI wave on agents, not chatbots↗techcrunch.com
- 10
Google, IO 2026에서 업데이트된 데스크톱 앱과 CLI 툴과 함께 Antigravity 2.0 출시
구글은 Google IO 2026에서 멀티 에이전트 오케스트레이션과 커스텀 워크플로우를 지원하는 Antigravity 2.0을 발표했습니다. 이번 업데이트에는 Gemini 3.5 Flash 기반의 강력한 성능, 개발자를 위한 CLI 및 SDK 출시, 그리고 검색 엔진 내 실시간 UI 생성 기능이 포함되어 개발 및 검색 경험의 혁신을 예고했습니다.
Google launches Antigravity 2.0 with an updated desktop app and CLI tool at IO 2026↗techcrunch.com
- 11
Google의 제미니 옴니, 이미지, 오디오, 텍스트를 비디오로 변환하다 — 그리고 이건 시작에 불과하다
구글은 다양한 형태의 데이터를 통합적으로 추론하여 고품질 비디오를 생성하는 '제미니 옴니' 모델군을 발표했습니다. 이 모델은 텍스트 명령만으로 사진 편집 및 디지털 아바타 생성이 가능하며, 향후 광고 및 영상 제작 등 엔터프라이즈 워크플로우 전반에 혁신을 가져올 전망입니다.
Google’s Gemini Omni turns images, audio, and text into video — and that’s just the start↗techcrunch.com
- 12
Google, ChatGPT와 Claude에 맞서 Gemini 앱 업데이트
구글은 Google I/O에서 Gemini 앱의 대대적인 업데이트를 발표하며, 개인 맞춤형 요약 기능인 'Daily Brief'와 24시간 백그라운드 작업을 수행하는 AI 에이전트 'Gemini Spark'를 공개했습니다. 또한 새로운 비디오 생성 모델인 'Gemini Omni'를 도입하여 텍스트를 넘어 영상 제작까지 가능한 멀티모달 AI 허브로의 전환을 선언했습니다.
Google updates its Gemini app to take on ChatGPT and Claude↗techcrunch.com
- 14
Google, Gemini 앱 업데이트로 ChatGPT 및 Claude에 도전, IO 2026에서 공개
구글은 Gemini 앱에 개인 비서 기능인 'Daily Brief'와 24시간 백그라운드 작업을 수행하는 AI 에이전트 'Gemini Spark'를 도입합니다. 또한 새로운 비디오 생성 모델인 'Gemini Omni'를 통해 멀티모달 콘텐츠 제작 역량을 강화하며, 사용자 경험을 개선한 새로운 디자인 언어를 적용합니다.
Google updates its Gemini app to take on ChatGPT and Claude at IO 2026↗techcrunch.com
- 15
구글, Gmail 연동된 24시간 AI 에이전트 Gemini Spark 출시
구글이 Gmail, Docs 등 구글 워크스페이스와 통합되어 사용자를 대신해 장기적인 업무를 수행하는 AI 에이전트 'Gemini Spark'를 발표했습니다. 이 에이전트는 클라우드 기반으로 24시간 작동하며, 사용자가 이메일을 보내는 것만으로도 웹 브라우징과 문서 작성을 자율적으로 수행할 수 있습니다.
Google introduces Gemini Spark, a 24/7 agentic assistant with Gmail integration↗techcrunch.com
- 17
OpenAI 공동 창업자 Andrej Karpathy, Anthropic의 사전 훈련팀 합류
OpenAI 공동 창업자인 안드레이 카파시가 앤스로픽의 사전 훈련(Pre-training) 팀에 합류하여 Claude 모델의 학습 효율을 높이는 연구를 이끌게 되었습니다. 그는 AI를 활용해 사전 훈련 연구를 가속화하는 팀을 구축할 예정이며, 이는 앤스로픽이 단순한 컴퓨팅 자원 확보를 넘어 AI 기반 연구 혁신을 통해 경쟁력을 확보하려는 전략적 움직임으로 풀이됩니다.
OpenAI co-founder Andrej Karpathy joins Anthropic’s pre-training team↗techcrunch.com
- 18
KPMG, 27만 6천 명 규모의 핵심 사업 및 인력에 Claude 통합, 전략적 제휴
글로벌 회계·컨설팅 기업 KPMG가 Anthropic과 손잡고 전 세계 27만 6천 명의 직원들에게 Claude를 제공하며, 자사의 디지털 플랫폼인 'Digital Gateway'에 AI 에이전트를 통합합니다. 이번 협력을 통해 세무, 법률, 사이버 보안 등 전문 서비스 영역에 AI를 적용하고, 사모펀드(PE) 포트폴리오 기업들을 위한 AI 솔루션 공동 개발에도 나섭니다.
KPMG integrates Claude across its core business and workforce of more than 276,000 in strategic alliance↗anthropic.com
- 20
클라우드플레어, Claude Managed Agents 출시 발표
Cloudflare와 Anthropic이 Claude Managed Agents를 Cloudflare Sandbox와 통합하여, AI 에이전트의 실행 환경을 더욱 안전하고 확장 가능하게 구축할 수 있는 솔루션을 출시했습니다. 개발자는 Anthropic의 강력한 모델을 사용하면서도, Cloudflare의 인프라를 통해 코드 실행, 보안 연결, 브라우저 제어 및 관찰 가능성을 직접 제어할 수 있습니다.
Announcing Claude Managed Agents on Cloudflare↗blog.cloudflare.com
- 22
Show HN: 깜찍한, 처음부터 만든 FlashAttention-2
저자는 NVIDIA의 CuTe 라이브러리를 사용하여 FlashAttention-2를 C++로 재구현하는 과정을 상세히 설명하며, 복잡한 설정을 배제한 단순화된 구조로도 A100에서 기존 성능의 88~105%를 달성했음을 보여줍니다. 이는 단순한 알고리즘 구현을 넘어, 난해한 CuTe 라이브러리를 활용한 고난도 GPU 커널 개발의 실전적인 가이드를 제공하는 데 목적이 있습니다.
Show HN: FlashAttention-2 in Cute, from Scratch↗blog.echen.io
- 23
LLMCap: 달러 제한을 초과하면 LLM API 호출을 즉시 중단하는 프록시
LLMCap은 OpenAI, Anthropic 등 주요 LLM 제공업체의 API 호출에 대해 설정된 달러 한도에 도달하면 즉시 429 에러를 반환하여 추가 비용 발생을 막는 프록시 솔루션입니다. 단 한 줄의 코드 변경만으로 적용 가능하며, VS Code 확장 프로그램과 CLI를 통해 실시간 비용 모니터링 기능을 제공합니다.
LLMCap – A proxy that hard-stops LLM API calls when you hit a dollar cap↗llmcap.io









