스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 05. 06. 오전 06:46 KST·총 24건

AI 모델 관련 글 — 47 페이지

0
Google Home의 Gemini AI, 더 복잡한 요청도 처리 가능
구글 홈의 Gemini AI가 3.1 버전으로 업그레이드되어, 단일 음성 명령으로 여러 작업을 동시에 처리하고 복잡한 멀티스텝 요청을 수행할 수 있게 되었습니다. 또한 웹 기반 관리 기능인 'Ask Home on Web'과 알림창 내 즉각 제어가 가능한 '퀵 액션' 기능이 추가되어 스마트 홈 제어의 편의성이 대폭 강화되었습니다.
Google Home’s Gemini AI can handle more complicated requests↗theverge.com
The Verge1개월 전공공지능 분석AI 모델
1
SWE-bench 팀의 새로운 벤치마크: 0% 해결률
최신 LLM들이 소프트웨어 아키텍처 설계 능력을 측정하는 새로운 벤치마크 'ProgramBench'에서 모두 0%의 해결률을 기록했습니다. 이 벤치마크는 소스 코드 없이 바이너리와 문서만으로 프로그램을 재구현하는 극한의 과제를 제시하며, 현재 AI의 한계를 명확히 보여줍니다.
Show HN: New Benchmark from SWE-bench team is 0% solved↗programbench.com
Hacker News Show1개월 전공공지능 분석AI 모델
2
GLM-5V-Turbo: 멀티모달 에이전트를 위한 네이티브 기반 모델으로의 진전
GLM-5V-Turbo는 멀티모달 인지 능력을 단순한 보조 인터페이스가 아닌 추론, 계획, 도구 사용의 핵심 엔진으로 통합한 차세대 네이티브 멀ument 기반 모델입니다. 이미지, 비디오, 웹페이지, GUI 등 다양한 시각적 컨텍스트를 직접 이해하고 실행할 수 있는 '멀티모달 에이전트' 구현을 위한 기술적 진보를 보여줍니다.
GLM-5V-Turbo: Toward a Native Foundation Model for Multimodal Agents↗arxiv.org
Hacker News1개월 전공공지능 분석AI 모델
3
제마 4 가속화: 멀티 토큰 예측 드래프터를 활용한 더 빠른 추론
구글이 Gemma 4 모델의 추론 속도를 최대 3배까지 높일 수 있는 '멀티 토큰 예측(MTP) 드래프터'를 공개했습니다. 스펙큘레이티브 디코딩(Speculative Decoding) 기술을 활용해 모델의 추론 품질 저하 없이 지연 시간(Latency)을 획기적으로 단능화하여, 에지 디바이스부터 클라우드까지 더 빠르고 효율적인 AI 서비스 구현을 가능하게 합니다.
Accelerating Gemma 4: faster inference with multi-token prediction drafters↗blog.google
Hacker News1개월 전공공지능 분석AI 모델
4
Character.AI, 면허가 있다고 주장하는 챗봇 개발로 소송 당해
Character.AI가 챗봇을 통해 의사 면허가 있다고 허위 주장하며 무면허 의료 행위를 한 혐의로 펜실베이니아주로부터 소송을 당했습니다. 이번 사건은 AI의 환각(Hallucination) 현상이 단순한 오류를 넘어 법적 책임과 규제 문제로 직결될 수 있음을 보여줍니다.
Character.AI sued over chatbot that claims to be a real doctor with a license↗arstechnica.com
Ars Technica1개월 전공공지능 분석AI 모델
5
애플, iOS 27을 AI 모델 선택형 어드벤처로 구상
애플이 iOS 27에서 사용자가 구글, 앤스로픽 등 다양한 서드파티 대규모 언어 모델(LLM)을 직접 선택해 사용할 수 있는 'Extensions' 기능을 도입할 계획입니다. 이를 통해 Siri, 글쓰기 도구 등 iOS의 핵심 기능에 다양한 AI 모델의 능력을 통합하여, 애플을 AI 모델의 플랫폼화하려는 전략을 보여줍니다.
Apple plans to make iOS 27 a Choose Your Own Adventure of AI models↗techcrunch.com
TechCrunch1개월 전공공지능 분석AI 모델
6
RAG(검색 증강 생성)이란 무엇일까요? 쉽게 설명하는 가이드
RAG(검색 증강 생성)는 LLM이 외부 지식 베이스를 실시간으로 참조하여 답변하도록 하는 기술로, 모델의 환각 현상을 방지하고 최신 및 내부 데이터를 활용할 수 있게 합니다. 텍스트를 벡터화하여 저장하고, 질문과 유사한 정보를 찾아 답변의 근거로 제공하는 것이 핵심 원리입니다.
What Is RAG (Retrieval-Augmented Generation)? A Plain-English Guide↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
7
애플, iOS 27에서 선호하는 AI 모델 선택 기능 제공할 수 있을까
애플이 iOS 27부터 사용자가 ChatGPT 외에도 구글, 앤스로픽 등 선호하는 제3자 AI 모델을 선택해 시스템 전반에서 사용할 수 있는 'AI 익스텐션' 기능을 도입할 계획입니다. 이를 통해 Siri, 글쓰기 도구, 이미지 플레이그라운드 등 애플 인텔리전스의 핵심 기능들을 다양한 외부 AI 모델로 구동할 수 있게 됩니다.
Apple could let you pick a favorite AI model in iOS 27↗theverge.com
The Verge1개월 전공공지능 분석AI 모델
8
LLM API 런타임 규정 준수 프록시 (EU AI Act)
202나 2026년 8월 시행될 EU AI Act 및 캘리포니아 SB 942 규제에 대응하기 위해, LLM API 요청을 실시간으로 모니터링하고 보안 위협을 차단하는 Go 기반 리버스 프록시 솔루션 'AIR Blackbox'를 소개합니다. 이 도구는 프롬프트 인젝션 탐지, 개인정보(PII) 유출 방지, 위변조 불가능한 감사 로그 생성을 통해 AI 에이전트의 규제 준수를 자동화합니다.
Runtime Compliance Proxy for LLM APIs (EU AI Act)↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
9
LLM 게이트웨이의 DevPass
DevPass는 200개 이상의 코딩 모델을 3가지 정액제(Flat Price)로 통합 제공하는 LLM 게이트웨이입니다. OpenAI 호환 도구에 환경 변수 설정만으로 즉시 적용 가능하며, 지출 대비 모델 사용량을 최대 3배까지 효율화할 수 있는 솔루션입니다.
DevPass by LLM Gateway↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
10
OpenAI, ChatGPT 신규 기본 모델의 환각 현상 현저히 감소한다고 발표
OpenAI가 환각 현상을 획기적으로 줄인 새로운 기본 모델 'GPT-5.5 Instant'를 발표했습니다. 이 모델은 의료, 법률, 금융 등 고위험 분야에서 환각 발생률을 52.5% 낮췄으며, Gmail 등 개인 데이터와의 연동을 통한 개인화된 응답 능력을 강화했습니다.
OpenAI claims ChatGPT’s new default model hallucinates way less↗theverge.com
The Verge1개월 전공공지능 분석AI 모델
11
출판사들이 Meta를 상대로 AI의 '단어 그대로' 복제 혐의로 소송 제기
메타(Meta)가 Llama AI 모델을 학습시키는 과정에서 LibGen, Sci-Hub 등 불법 복제 사이트의 저작물을 무단으로 사용했다는 혐의로 대형 출판사들로부터 집단 소송을 당했습니다. 이번 소송은 단순히 AI 학습의 '공정 이용(Fair Use)' 여부를 넘어, '불법 데이터셋 사용'이라는 구체적인 저작권 침해를 다루고 있어 AI 업계의 큰 파장이 예상됩니다.
Book publishers sue Meta over AI’s ‘word-for-word’ copying↗theverge.com
The Verge1개월 전공공지능 분석AI 모델
12
루마 유니 1.1 API
Luma AI가 사용자의 의도를 생성 전 단계에서 해석하는 'Luma Uni 1.1 API'를 출시했습니다. 기존 모델 대비 비용과 지연 시간을 50% 이상 절감하여, 고품질 3D 및 생성형 미디어 제작을 위한 경제적이고 효율적인 개발 환경을 제공합니다.
Luma Uni 1.1 API↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
13
아카이브, AI 기반 API 플랫폼으로 GPU 활용 극대화
Arkiv는 디자이너의 지식재산권(IP) 보호를 위해 블록체인을 활용하는 새로운 서비스입니다. 파일을 서버에 업로드하지 않고도 로컬 기기에 파일을 유지한 채 블록체인에 영구적인 증거를 남기는 'Zero-upload' 기술을 핵심 가치로 내세웁니다.
Arkiv↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
14
$28/월 DigitalOcean GPU Droplet에서 vLLM으로 Mixtral 8x7B 배포하는 방법: Mixture-of-Experts 추론, API 비용의 1/75로
OpenAI나 Claude 같은 고가의 LLM API 대신, DigitalOcean의 저렴한 GPU Droplet과 vLLM 엔진을 활용해 Mixtral 8x7B 모델을 직접 배포함으로써 추론 비용을 최대 1/75 수준으로 절감하는 방법을 소개합니다. 이 방식은 비용뿐만 아니라 지연 시간(Latency)과 데이터 프라이버시 측면에서도 압도적인 우위를 점할 수 있음을 보여줍니다.
How to Deploy Mixtral 8x7B with vLLM on a $28/Month DigitalOcean GPU Droplet: Mixture-of-Experts Inference at 1/75th API Cost↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
15
프로덕션 환경에서 5개의 AI API를 사용할 때 깨지는 것들 (2026년판)
2026년 AI 서비스 개발의 핵심인 멀티 모델(Multi-model) 전략은 모델별 응답 형식, 스트리밍 규격, 레이트 리밋(Rate Limit)의 파편화로 인해 심각한 운영 장애를 초래할 수 있습니다. 이를 극복하기 위해서는 각 API의 불일치를 표준화하는 어댑터 레이어 구축과 연쇄적 장애를 방지하는 정교한 트래픽 관리 설계가 필수적입니다.
What Breaks When You Use 5 Different AI APIs in Production (2026 Edition)↗dev.to
Dev.to DevOps1개월 전공공지능 분석AI 모델
16
GPT-5.5 Instant: 더 똑똑하고 명확하며 개인화된
OpenAI가 ChatGPT의 기본 모델을 업그레이드한 'GPT-5.5 Instant'를 공개했습니다. 이번 업데이트는 모델의 지능과 답변 정확도를 높이고, 고질적인 문제인 환각 현상을 줄이며, 사용자 맞춤형 개인화 제어 기능을 강화하는 데 집중했습니다.
GPT-5.5 Instant: smarter, clearer, and more personalized↗openai.com
OpenAI Blog1개월 전공공지능 분석AI 모델
17
Google Chrome, 동의 없이 4GB AI 모델을 기기에 자동 설치
구글 크롬이 사용자 동의 없이 약 4GB 크기의 Gemini Nano AI 모델(weights.bin)을 사용자 기기에 자동으로 설치하고 있다는 사실이 밝혀졌습니다. 이 과정에서 사용자 선택권이 배제되었을 뿐만 아니라, 대규모 다운로드로 인한 환경적 비용과 GDPR 등 개인정보 보호 규정 위술 가능성이 제기되고 있습니다.
Google Chrome silently installs a 4 GB AI model on your device without consent↗thatprivacyguy.com
Hacker News1개월 전공공지능 분석AI 모델
18
AI 모델, 처음부터 직접 학습시키기
이 기사는 Andrej Karpathy의 nanoGPT에서 영감을 얻은, GPT 모델을 처음부터 직접 구축하고 학습시키는 핸즈온 워크숍을 소개합니다. 약 1,000만 개의 파라미터를 가진 소규모 모델을 노트북 환경에서 1시간 이내에 학습시키는 과정을 통해 트랜스포머의 핵심 구조를 이해하도록 돕습니다.
Train Your Own LLM from Scratch↗github.com
Hacker News1개월 전공공지능 분석AI 모델
19
AI SDK 공급망 위험도 순위 분석 결과, LangChain은 탈락했습니다.
주요 AI SDK의 공급망 보안 위험도를 분석한 결과, LangChain이 가장 높은 위험도를 기록하며 최하위를 차지했습니다. 반면 OpenAI와 Vercel AI SDK는 매우 안전한 것으로 나타났으며, Anthropic SDK는 관리되지 않는 하위 종속성으로 인해 잠재적 위험을 안고 있는 것으로 밝혀졌습니다.
I Ranked AI SDKs by Supply Chain Risk. LangChain Lost.↗dev.to
Dev.to WebDev1개월 전공공지능 분석AI 모델
20
언어 감지 API — 100+ 언어, 신뢰도 점수와 함께
Language Detector Pro는 100개 이상의 언어를 감지하고 ISO 639-1 코드와 신뢰도 점수를 제공하는 API 서비스입니다. 텍스트 기반의 사용자 생성 콘텐츠(UGC)를 처리해야 하는 글로벌 서비스의 라우팅, 필터링, 개인화 기능을 자동화하는 데 최적화되어 있습니다.
Language Detection API — 100+ Languages with Confidence Score↗dev.to
Dev.to WebDev1개월 전공공지능 분석AI 모델
21
그림 뒤편
생성형 AI는 시각적으로 완벽한 '앞면(결과물)'을 만들어내지만, 그 이면에 담긴 역사, 맥락, 시간의 흔적인 '뒷면(과정)'을 구현하지 못합니다. 이는 모든 것이 매끈하고 아름답지만, 출처를 알 수 없고 역사가 결여된 '무색무무취한 디지털 세계'로의 진입에 대한 경고를 담고 있습니다.
The Back of the Painting↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
22
디나, AI 기반 API 플랫폼으로 GPU 활용 극대화
Dina는 화면 녹화, 영상 편집, AI 자막 생성, TTS 등을 하나의 macOS 앱에서 처리할 수 있는 올인원 영상 워크플로우 솔루션입니다. 여러 도구를 번거롭게 오갈 필요 없이 전문가 수준의 결과물을 빠르게 만들어내는 데 집중합니다.
Dina↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
23
트랜스포머는 본질적으로 간결하다 (2025)
트랜스포머가 기존의 유한 오토마타(Finite Automata)나 선형 시상 논리(LTL)보다 복잡한 언어를 훨씬 더 간결하게 표현할 수 있음을 수학적으로 증명한 연구입니다. 하지만 이러한 높은 표현력 때문에 트랜스포머의 속성을 검증하는 작업은 계산적으로 매우 어려운(EXPSPACE-complete) 문제임이 밝혀졌습니다.
Transformers Are Inherently Succinct (2025)↗arxiv.org
Hacker News1개월 전공공지능 분석AI 모델