스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 05. 20. 오전 04:42 KST·총 24건

AI 모델 관련 글 — 27 페이지

0
같은 OpenClaw 실수, 매 작업마다 비싼 모델 하나씩 사용하고 있었네
에이전트 시스템 운영 시 모든 태스크에 단일 고가 모델을 사용하는 것은 비효율적인 비용 구조를 초래합니다. 분류, 요약 등 단순 작업에는 저렴한 모델을, 복잡한 추론이 필요한 작업에는 고성능 모델을 배치하는 '모델 라우팅'을 통해 비용을 획기적으로 줄여야 합니다.
I kept seeing the same OpenClaw mistake: one expensive model for every job↗dev.to
Dev.to DevOps21일 전공공지능 분석AI 모델
1
카글 GPU에서 사용 가능한 무료 35B 멀티모달 LLM 서버 — 모든 OpenAI 호환 클라이언트에서 접근 가능
이 글은 Kaggle의 무료 T4 GPU를 활용하여 Qwen3.6-35B 모델을 안정적인 API 서버로 구축하는 구체적인 아키텍처를 설명합니다. llama.cpp와 Cloudflare Quick Tunnel을 결과하여 세션 만료와 연결 끊김 문제를 해결하고, 모델과 바이너리를 Kaggle 데이터셋으로 관리하여 효율성을 극대화하는 노하우를 담고 있습니다.
Free 35B Multimodal LLM Server on Kaggle GPU — Accessible from Any OpenAI-Compatible Client↗dev.to
Dev.to OpenSource21일 전공공지능 분석AI 모델
2
두 개의 AI 기반 과학 어시스턴트, 약물 재창출 업무에서 성공
구글과 FutureHouse가 개발한 새로운 AI 에이전트들이 방대한 생물학적 데이터를 분석하여 기존 약물을 새로운 질병 치료에 활용할 수 있는 가설을 성공적으로 제안했습니다. 이 시스템들은 인간 과학자를 대체하는 것이 아니라, 파편화된 연구 결과 사이의 숨겨진 연결고리를 찾아내어 과학적 발견의 효율성을 극대화하는 데 초점을 맞추고 있습니다.
Two AI-based science assistants succeed with drug-retargeting tasks↗arstechnica.com
Ars Technica21일 전공공지능 분석AI 모델
3
Google의 SynthID AI 워터마킹 기술, OpenAI, Nvidia 등에서 채택
구글의 SynthID 기술이 구글 자체 모델을 넘어 OpenAI, Nvidia, 카카오, ElevenLabs 등 주요 AI 기업들의 시스템으로 확대 적용됩니다. 이 기술은 이미지의 픽셀이나 오디오의 파형에 워터마크를 직접 심어, 압축이나 편집 후에도 AI 생성 여부를 식별할 수 있는 강력한 내성을 제공합니다.
Google's SynthID AI watermarking tech is being adopted by OpenAI, Nvidia, and more↗arstechnica.com
Ars Technica21일 전공공지능 분석AI 모델
4
Gemini 3.5 Flash, 생성형 AI가 의미를 파악하기에 충분히 빠를 수 있을까
구글이 고성능·고효율 모델인 Gemini 3.5 Flash를 공개하며, 기존 Pro 모델 수준의 성능을 훨씬 빠른 속도와 낮은 비용으로 제공합니다. 이번 업데이트는 특히 복잡한 작업을 수행하는 AI 에이전트 기술의 상용화 가능성을 높이는 데 초점을 맞추고 있습니다.
Gemini 3.5 Flash might be fast enough for gen AI to make sense↗arstechnica.com
Ars Technica21일 전공공지능 분석AI 모델
5
구글 I/O 2026에서 발표된 13가지 가장 큰 소식
구글은 Gemini 3.5 Flash와 멀티모달 기능이 강화된 Gemini Omni를 통해 AI 에이전트 및 비디오 생성 능력을 대폭 강화했습니다. 또한, 프롬프트만으로 안드로이드 앱을 제작하는 AI Studio의 혁신과 스마트 글래스 생태계 확장을 통해 하드웨어와 소프트웨어를 아우르는 AI 통합 전략을 발표했습니다.
The 13 biggest announcements at Google I/O 2026↗theverge.com
The Verge21일 전공공지능 분석AI 모델
6
Google 제니 세계 모델, 스트리트 뷰와 같은 실제 거리 시뮬레이션 가능
구글 딥마인드는 스트리트 뷰의 2,800억 개 이상의 이미지를 활용해 현실 세계를 가상으로 재구성하는 세계 모델 'Genie'에 스트리트 뷰 데이터를 통합했습니다. 이를 통해 로보틱스, 자율주행, 게임 분야에서 극히 드문 환경 변화나 시점 변화를 정교하게 시뮬레이션할 수 있는 기반을 마련했습니다.
Google’s Genie world model can now simulate real streets with Street View↗techcrunch.com
TechCrunch21일 전공공지능 분석AI 모델
7
제미니 3.5 플래시로 구글, 챗봇 대신 에이전트에 미래 AI 역량 집중
구글은 코딩과 자율 에이전트 작업에 최적화된 새로운 AI 모델인 제미니 3.5 플래시를 발표하며, 챗봇 중심에서 에이전트 중심으로의 기술적 전환을 선언했습니다. 이 모델은 기존 모델 대비 최대 12배 빠른 속도를 제공하며, 상위 모델인 3.5 프로와 협업하여 복잡한 워크플로우를 자율적으로 수행하는 에이전트 생태계를 구축합니다.
With Gemini 3.5 Flash, Google bets its next AI wave on agents, not chatbots↗techcrunch.com
TechCrunch21일 전공공지능 분석AI 모델
8
구글, Anthropic의 Mythos와 경쟁하려 한다
구글은 I/O 2026에서 AI 기반 코드 보안 도구인 CodeMender의 API 테스트를 전문가 그룹으로 확대하며 사이버 보안 시장 공략을 강화한다고 발표했습니다. 이는 앤스로픽의 Mythos와 OpenAI의 보안 모델에 대응하는 움직임으로, AI 모델의 보안 활용 능력이 차세대 핵심 수익 모델로 부상하고 있음을 보여줍니다.
Google wants to compete with Anthropic’s Mythos↗theverge.com
The Verge21일 전공공지능 분석AI 모델
9
OpenAI, 자사 모델이 생성한 이미지인지 확인하기 쉽게 만들다
OpenAI는 자사 모델로 생성된 이미지의 출처를 명확히 하기 위해 C2PA 표준을 채택하고 구글의 SynthID 기술을 도입합니다. 이는 메타데이터 기반의 정보 제공과 이미지 변조에도 유지되는 보이지 않는 워터마크를 결합하여 AI 생성 콘텐츠의 오남용을 방지하려는 목적을 가집니다.
OpenAI is making it easier to check if an image was made by their models↗techcrunch.com
TechCrunch21일 전공공지능 분석AI 모델
10
Google, IO 2026에서 업데이트된 데스크톱 앱과 CLI 툴과 함께 Antigravity 2.0 출시
구글은 Google IO 2026에서 멀티 에이전트 오케스트레이션과 커스텀 워크플로우를 지원하는 Antigravity 2.0을 발표했습니다. 이번 업데이트에는 Gemini 3.5 Flash 기반의 강력한 성능, 개발자를 위한 CLI 및 SDK 출시, 그리고 검색 엔진 내 실시간 UI 생성 기능이 포함되어 개발 및 검색 경험의 혁신을 예고했습니다.
Google launches Antigravity 2.0 with an updated desktop app and CLI tool at IO 2026↗techcrunch.com
TechCrunch21일 전공공지능 분석AI 모델
11
Google의 제미니 옴니, 이미지, 오디오, 텍스트를 비디오로 변환하다 — 그리고 이건 시작에 불과하다
구글은 다양한 형태의 데이터를 통합적으로 추론하여 고품질 비디오를 생성하는 '제미니 옴니' 모델군을 발표했습니다. 이 모델은 텍스트 명령만으로 사진 편집 및 디지털 아바타 생성이 가능하며, 향후 광고 및 영상 제작 등 엔터프라이즈 워크플로우 전반에 혁신을 가져올 전망입니다.
Google’s Gemini Omni turns images, audio, and text into video — and that’s just the start↗techcrunch.com
TechCrunch21일 전공공지능 분석AI 모델
12
Google, ChatGPT와 Claude에 맞서 Gemini 앱 업데이트
구글은 Google I/O에서 Gemini 앱의 대대적인 업데이트를 발표하며, 개인 맞춤형 요약 기능인 'Daily Brief'와 24시간 백그라운드 작업을 수행하는 AI 에이전트 'Gemini Spark'를 공개했습니다. 또한 새로운 비디오 생성 모델인 'Gemini Omni'를 도입하여 텍스트를 넘어 영상 제작까지 가능한 멀티모달 AI 허브로의 전환을 선언했습니다.
Google updates its Gemini app to take on ChatGPT and Claude↗techcrunch.com
TechCrunch21일 전공공지능 분석AI 모델
13
AI 모드가 미국인들의 검색 방식에 변화를 가져오고 있다
구글의 AI 모드가 미국 출시 1년 만에 글로벌 MAU 10억 명을 돌파하며 검색 방식의 근본적인 변화를 이끌고 있습니다. 사용자는 이제 텍스트를 넘어 이미지와 음성을 활용하고, 단순 키워드 검색 대신 긴 문장 형태의 질문을 통해 계획 수립과 의사결정을 위한 복합적인 검색을 수행하고 있습니다.
How AI Mode is changing the way people search in the U.S.↗blog.google
Google AI Blog21일 전공공지능 분석AI 모델
14
Google, Gemini 앱 업데이트로 ChatGPT 및 Claude에 도전, IO 2026에서 공개
구글은 Gemini 앱에 개인 비서 기능인 'Daily Brief'와 24시간 백그라운드 작업을 수행하는 AI 에이전트 'Gemini Spark'를 도입합니다. 또한 새로운 비디오 생성 모델인 'Gemini Omni'를 통해 멀티모달 콘텐츠 제작 역량을 강화하며, 사용자 경험을 개선한 새로운 디자인 언어를 적용합니다.
Google updates its Gemini app to take on ChatGPT and Claude at IO 2026↗techcrunch.com
TechCrunch21일 전공공지능 분석AI 모델
15
구글, Gmail 연동된 24시간 AI 에이전트 Gemini Spark 출시
구글이 Gmail, Docs 등 구글 워크스페이스와 통합되어 사용자를 대신해 장기적인 업무를 수행하는 AI 에이전트 'Gemini Spark'를 발표했습니다. 이 에이전트는 클라우드 기반으로 24시간 작동하며, 사용자가 이메일을 보내는 것만으로도 웹 브라우징과 문서 작성을 자율적으로 수행할 수 있습니다.
Google introduces Gemini Spark, a 24/7 agentic assistant with Gmail integration↗techcrunch.com
TechCrunch21일 전공공지능 분석AI 모델
16
I/O 2026: 에이전트 Gemini 시대에 오신 것을 환영합니다
구글은 I/O 2026을 통해 월 3.2경 토큰 처리라는 폭발적인 성장을 발표하며, 단순 생성형 AI를 넘어 사용자의 복잡한 과업을 수행하는 '에이전트' 중심의 Gemini 시대를 선포했습니다. 검색, 지도, 유튜브 등 구글의 주요 서비스에 자연스러운 대화형 AI 기능이 통합되어 사용자 경험이 근본적으로 변화하고 있습니다.
I/O 2026: Welcome to the agentic Gemini era↗blog.google
Google AI Blog21일 전공공지능 분석AI 모델
17
OpenAI 공동 창업자 Andrej Karpathy, Anthropic의 사전 훈련팀 합류
OpenAI 공동 창업자인 안드레이 카파시가 앤스로픽의 사전 훈련(Pre-training) 팀에 합류하여 Claude 모델의 학습 효율을 높이는 연구를 이끌게 되었습니다. 그는 AI를 활용해 사전 훈련 연구를 가속화하는 팀을 구축할 예정이며, 이는 앤스로픽이 단순한 컴퓨팅 자원 확보를 넘어 AI 기반 연구 혁신을 통해 경쟁력을 확보하려는 전략적 움직임으로 풀이됩니다.
OpenAI co-founder Andrej Karpathy joins Anthropic’s pre-training team↗techcrunch.com
TechCrunch21일 전공공지능 분석AI 모델
18
KPMG, 27만 6천 명 규모의 핵심 사업 및 인력에 Claude 통합, 전략적 제휴
글로벌 회계·컨설팅 기업 KPMG가 Anthropic과 손잡고 전 세계 27만 6천 명의 직원들에게 Claude를 제공하며, 자사의 디지털 플랫폼인 'Digital Gateway'에 AI 에이전트를 통합합니다. 이번 협력을 통해 세무, 법률, 사이버 보안 등 전문 서비스 영역에 AI를 적용하고, 사모펀드(PE) 포트폴리오 기업들을 위한 AI 솔루션 공동 개발에도 나섭니다.
KPMG integrates Claude across its core business and workforce of more than 276,000 in strategic alliance↗anthropic.com
Anthropic Blog21일 전공공지능 분석AI 모델
19
AVTR-1 실시간 오픈 웨이트 모델
Avaturn Live가 실시간 상호작용이 가능한 AI 아바타 모델 AVTR-1을 오픈 소스로 출시했습니다. 이 모델은 풀 듀플렉스(Full-duplex) 기능을 통해 사용자의 말을 경청하며 실시간으로 표정과 움직임을 생성하여 지연 시간을 최소화한 인간적인 경험을 제공합니다.
AVTR-1 Real-Time Open Weights Model↗producthunt.com
Product Hunt21일 전공공지능 분석AI 모델
20
클라우드플레어, Claude Managed Agents 출시 발표
Cloudflare와 Anthropic이 Claude Managed Agents를 Cloudflare Sandbox와 통합하여, AI 에이전트의 실행 환경을 더욱 안전하고 확장 가능하게 구축할 수 있는 솔루션을 출시했습니다. 개발자는 Anthropic의 강력한 모델을 사용하면서도, Cloudflare의 인프라를 통해 코드 실행, 보안 연결, 브라우저 제어 및 관찰 가능성을 직접 제어할 수 있습니다.
Announcing Claude Managed Agents on Cloudflare↗blog.cloudflare.com
Cloudflare Blog21일 전공공지능 분석AI 모델
21
Rixx
Rixx는 검색, 분석, 작성을 하나의 프로세스로 통합한 AI 기반 리서치 도구로, Perplexity의 강력한 대안을 표방합니다. 사용자는 웹 검색과 문서 분석을 통해 신뢰할 수 있는 인용구가 포함된 결과물을 얻고, 이를 즉시 블로그나 보고서 형태로 변환할 수 있습니다.
Product Hunt↗producthunt.com
Product Hunt21일 전공공지능 분석AI 모델
22
Show HN: 깜찍한, 처음부터 만든 FlashAttention-2
저자는 NVIDIA의 CuTe 라이브러리를 사용하여 FlashAttention-2를 C++로 재구현하는 과정을 상세히 설명하며, 복잡한 설정을 배제한 단순화된 구조로도 A100에서 기존 성능의 88~105%를 달성했음을 보여줍니다. 이는 단순한 알고리즘 구현을 넘어, 난해한 CuTe 라이브러리를 활용한 고난도 GPU 커널 개발의 실전적인 가이드를 제공하는 데 목적이 있습니다.
Show HN: FlashAttention-2 in Cute, from Scratch↗blog.echen.io
Hacker News Show21일 전공공지능 분석AI 모델
23
LLMCap: 달러 제한을 초과하면 LLM API 호출을 즉시 중단하는 프록시
LLMCap은 OpenAI, Anthropic 등 주요 LLM 제공업체의 API 호출에 대해 설정된 달러 한도에 도달하면 즉시 429 에러를 반환하여 추가 비용 발생을 막는 프록시 솔루션입니다. 단 한 줄의 코드 변경만으로 적용 가능하며, VS Code 확장 프로그램과 CLI를 통해 실시간 비용 모니터링 기능을 제공합니다.
LLMCap – A proxy that hard-stops LLM API calls when you hit a dollar cap↗llmcap.io
Hacker News21일 전공공지능 분석AI 모델