스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 05. 21. 오전 05:16 KST·총 24건

AI 모델 관련 글 — 25 페이지

0
자체 진화하는 검색 기능, 벤치마크 점수 25% 향상
EvolveMem은 LLM 에이전트가 실행 중에 검색 구성을 스스로 조정하여 기존 정적 방식보다 벤락마크 성능을 약 25.7% 높이는 기술입니다. 진단 모듈이 실패 로그를 분석해 검색 전략을 재설계하고, 성능 저하를 방지하는 안전장치까지 갖추어 자율적인 메모리 최적화를 구현했습니다.
Self-evolving retrieval lifts benchmark scores 25%↗dev.to
Dev.to AI20일 전공공지능 분석AI 모델
1
AI 인프라를 위한 자가 치유식 킬 스위치 구축
AI 플랫폼은 무한 루프나 토큰 과다 사용으로 인해 시스템 다운이 아닌 '재정적 파산'이라는 독특한 실패 모드를 가집니다. 이를 해결하기 위해 개발된 EPA는 이상 징후 감지 시 시스템을 단계적으로 격리, 보존, 복구하여 인적 개입 없이도 인프라의 피해 범위를 최소화합니다.
Building a Self-Healing Kill Switch for AI Infrastructure↗dev.to
Dev.to AI20일 전공공지능 분석AI 모델
2
OUKC: AI 친화적인 다국어 세계관 공통 기반 (창립 문서) - Paper 144 v0.3.1
OUKC는 AI가 논리적 구조를 직접 이해하고 검증할 수 있도록 기계 판독 가능한 고밀도 지식 체계를 구축하는 프로젝트입니다. Lean 4 기반의 형식 증명과 재현 가능한 검증 메커니즘을 통해, 단순한 정보 전달을 넘어 학문적 깊이를 보존하는 AI 친화적 지식 생태계 구축을 목표로 합니다.
Paper 144 v0.3.1 — OUKC: An AI-Friendly Multilingual Worldview Commons (Founding Document)↗dev.to
Dev.to OpenSource20일 전공공지능 분석AI 모델
3
I/O 2026에서 발표한 100가지 내용
구글은 I/O 2026을 통해 고성능·저비용의 Gemini 3.5 Flash와 모든 입력을 통합 처리하는 차세대 멀티모달 모델 Gemini Omni를 발표했습니다. 특히 에이전트 중심의 개발 환경과 유튜브 등 기존 서비스와의 강력한 결합을 통해 AI의 실질적인 실행력과 창무적 활용도를 극대화했습니다.
100 things we announced at I/O 2026↗blog.google
Google AI Blog20일 전공공지능 분석AI 모델
4
Google I/O 리뷰 (5/5) — Google, Gemini CLI 조용히 종료
구글이 개발자들의 높은 지지를 받던 오픈소스 Gemini CLI를 종료하고, 무료 사용량을 98% 축소한 폐쇄형 Antigravity CLI로 전환한다고 발표했습니다. 이번 결정은 I/O 컨퍼런스 기간 중 조용히 발표되었으며, 이로 인해 개발자들은 Claude Code나 로컬 LLM 기반의 대안을 찾기 시작했습니다.
Google I/O Review (4/5) — Google Quietly Killed Gemini CLI↗dev.to
Dev.to OpenSource20일 전공공지능 분석AI 모델
5
이제 AI로 다른 사람의 YouTube Shorts를 리믹스할 수 있습니다.
구글은 Google I/O 2026에서 Gemini Omni를 이용해 유튜브 쇼츠의 스타일을 바꾸거나 영상 내용을 재구성할 수 있는 '리믹스' 기능을 공개했습니다. 사용자는 프롬프트만으로 영상을 애니메이션이나 픽셀 아트로 변환할 수 있으며, 인물의 의상을 바꾸거나 자신을 영상에 삽입하는 고도의 편집을 손쉽게 수행할 수 있습니다.
You can now remix other people’s YouTube Shorts with AI↗theverge.com
The Verge20일 전공공지능 분석AI 모델
6
Stability AI, 6분 길이의 노래를 만들 수 있는 새로운 오디오 모델 출시
Stability AI가 최대 6분 20초 길이의 음악을 생성할 수 있는 새로운 오디오 모델인 Stability Audio 3.0을 공개했습니다. 이번 모델군은 온디바이스용 소형 모델부터 API 전용 대형 모델까지 포함하며, 특히 음악 레이블과 정식 계약된 라이선스 데이터를 사용하여 저작권 리스크를 최소화한 것이 특징입니다.
Stability AI releases a new audio model that can create 6-minute songs↗techcrunch.com
TechCrunch20일 전공공지능 분석AI 모델
7
AutoSubtitles 2.0
AutoSubtitles 2.0은 브라우저에서 바로 사용할 수 있는 차세대 AI 자막 생성 서비스로, 텍스트 변환부터 애니메이션 자막 적용까지 원스톱으로 제공합니다. 특히 바이럴 스타일의 프리셋과 자동 이모지 기능을 통해 복잡한 영상 편집 기술 없이도 고품질의 소셜 미디어용 영상을 제작할 수 있게 돕습니다.
Product Hunt↗producthunt.com
Product Hunt20일 전공공지능 분석AI 모델
8
우리가 어디로 향하고 있는지 알 수 있는 방법은 없어
비문학 저자의 책에 AI가 만든 가짜 인용구가 포함된 사례와 노벨상 수상자의 AI 활용 고백은 정보의 진위 판별이 어려워진 시대를 보여줍니다. 동시에 구글은 검색 엔진을 AI 기반의 인터랙티브 경험으로 재편하며, Gemini를 모든 서비스에 공격적으로 통합하고 있습니다.
There's no earthly way of knowing which direction we are going↗kottke.org
Hacker News20일 전공공지능 분석AI 모델
9
인포마니악, 사용자 데이터 개인 정보 보호를 위해 기반 모델로 전환
스위스의 클라우드 서비스 기업 인포마니악은 창업주 보리스 지겐탈러가 의결권 과반을 공익 재단에 이전함으로써 기업의 핵심 가치인 프라이버시와 환경 책임을 영구적으로 보장하기로 했습니다. 이번 결정은 외부 투자자나 인수합병 시도에 관계없이 기업의 정체성을 유지하고 디지털 주권을 수호하기 위한 구조적 장치를 마련한 것입니다.
Infomaniak transitions to a foundation model to protect user data privacy↗news.infomaniak.com
Hacker News20일 전공공지능 분석AI 모델
10
Swift에서 LLM 학습: Gflop/s에서 Tflop/s로 행렬 곱셈 최적화
LLM 학습의 핵심인 행렬 곱셈(GEMM) 연산을 Apple Silicon에서 최적화하는 단계적 방법론을 다룹니다. 루프 재정렬부터 GPU 활용까지의 과정을 통해 메모리 대역폭 병목을 해결하고 연산 성능을 극대화하는 기술적 통찰을 제공합니다.
Training an LLM in Swift: Optimizing Matrix Multiplication from Gflop/s to Tflop/s↗dev.to
Dev.to WebDev20일 전공공지능 분석AI 모델
11
“디자이너 없이도 패키지 만든다”…패커티브, AI 디자인 자동화 공개
패커티브가 전문 디자인 툴 없이도 패키지 제작이 가능한 AI 기반 에디터 '패커티브 스튜디오'를 정식 출시했습니다. 사용자는 AI를 통해 디자인 시안을 생성하고 3D로 미리 확인한 뒤 즉시 제작 주문까지 진행할 수 있어, 초기 브랜드의 제작 진입장벽을 획기적으로 낮췄습니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어20일 전공공지능 분석AI 모델
12
Gemini Nano 온디바이스 함수 호출, Android 지원
이 글은 Gemini Nano의 온디바이스 함수 호출 기능을 사용하여 인터넷 연결 없이도 작동하는 안드로이드 AI 에이전트 구축 방법을 설명합니다. 32K라는 제한된 토큰 예산을 효율적으로 관리하는 스키마 최적화 기법과 모델의 환각 현상을 방지하기 위한 3단계 검증 파이프라인, 그리고 Room과 WorkManager를 이용한 오프라인 작업 큐잉 아키텍처를 제시합니다.
Gemini Nano On-Device Function Calling for Android↗dev.to
Dev.to WebDev20일 전공공지능 분석AI 모델
13
인도네시아에서 14일 만에 조작 방지 AI 감사 추적 API를 구축했습니다. EU AI Act 시행까지 72일. 제가 얻은 교훈은 다음과 같습니다.
인도네시아의 18세 개발자가 AI 결정 과정을 해시 체인으로 기록하고 글로벌 규제 준수 여부를 확인하는 API 'AIDAL'을 14일 만에 개발했습니다. 그는 단순한 규제 가이드라인 제공을 넘어, 데이터의 무결성을 수학적으로 증명할 수 있는 기술적 인프라를 구축함으로써 규제 준수의 실질적인 해결책을 제시하고 있습니다.
I built a tamper-proof AI audit trail API in 14 days from Indonesia. 72 days until EU AI Act. Here's what I learned.↗indiehackers.com
Indie Hackers20일 전공공지능 분석AI 모델
14
xAI의 "For You" 피드 공개 코드
xAI의 공개된 알고리즘 저장소를 통해 'For You' 피드가 단순한 게시물 정렬을 넘어 사용자 특성 예측, 게시물 품질 점수, 광고 컨텍스트 등 다양한 메타데이터를 포함하고 있음을 확인했습니다. 이 시스템은 랭킹을 넘어 다양한 소스의 아이템을 정교하게 배치하는 데이터 전달 체계로 작동합니다.
The Public Code Behind xAI's "For You" Feed↗dev.to
Dev.to OpenSource20일 전공공지능 분석AI 모델
15
AI를 위한 두 번째 뇌
'Second Brain for AI'는 대화가 종료되면 사라지는 LLM의 단기 기억 문제를 해결하기 위해 설계된 자가 호스팅형 메모리 레이어입니다. 사용자는 프로젝트, 결정 사항, 선호도를 저장하여 Claude, ChatGPT, Cursor 등 다양한 AI 클라이언트에서 의미 기반으로 재호출할 수 있습니다.
Second Brain for AI↗producthunt.com
Product Hunt20일 전공공지능 분석AI 모델
16
구글 I/O 2026, 검색·개발도구의 ‘에이전트화’ 선언…스타트업 경쟁 기준 바뀐다
구글은 Google I/O 2026을 통해 Gemini 3.5와 Antigravity 2.0을 공개하며, AI가 사용자의 업무를 직접 수행하는 '에이전트 시대'의 개막을 알렸습니다. 검색, 개발 도구, 커머스 등 구글 생태계 전반에 에이전트 기능이 기본 탑재됨에 따라 AI 기술의 패러다임이 생성에서 실행으로 변화하고 있습니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어20일 전공공지능 분석AI 모델
17
Claude가 GA4 데이터를 직접 쿼리할 수 있도록 하여 보고서 대기 시간 줄입니다.
Smacient는 Claude가 GA4 데이터에 직접 접근하여 자연어로 쿼리를 실행할 수 있게 돕는 MCP 커넥터입니다. 사용자는 복잡한 설정 없이도 실시간 사용자 수 확인, 기간별 성과 비교, 맞춤형 지표 분석 등을 영어 질문만으로 즉시 수행할 수 있습니다.
We let Claude query your GA4 data directly so you stop waiting for reports↗indiehackers.com
Indie Hackers20일 전공공지능 분석AI 모델
18
구글 I/O 2026, 검색·개발·쇼핑까지 ‘에이전트 AI’로 재편
구글은 제미나이 3.5와 옴니 모델을 공개하며 AI가 사용자의 워크플로우 내에서 작업을 직접 수행하는 에이전트 중심 전략을 발표했습니다. 특히 개발자 플랫폼인 안티그래비티 2.0과 검색 및 쇼핑 기능의 에이전트화를 통해 AI의 역할을 단순 보조에서 실행형 인터페이스로 확장하겠다는 계획입니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어20일 전공공지능 분석AI 모델
19
Claude에게 Meta Ads 데이터를 직접 접근할 수 있는 권한을 부여하여 보고서 다운로드 작업을 중단하세요
Smacient는 Claude에 Meta Ads 계정 접근 권한을 부여하여 실시간 광고 성과 분석을 가능하게 하는 MCP 커넥터입니다. 사용자는 별도의 데이터 다운로드나 복사-붙여넣기 없이 광고 캠페인, 소재 성과, 타겟 오디언스 및 예산 최적화 제안을 AI를 통해 즉각적으로 확인할 수 있습니다.
We gave Claude direct access to Meta Ads data so you can stop downloading reports↗indiehackers.com
Indie Hackers20일 전공공지능 분석AI 모델
20
AI 청구서는 확인할 수 있지만 설명할 수 없어서, AiKey를 만들었어요
AI 서비스 운영 시 발생하는 비용 급증의 원인(중복 호출, 컨텍스트 과부하, 재시도 폭풍 등)을 파악하기 어렵다는 문제를 해결하기 위해, 요청 단위의 비용 귀속과 거버넌스를 제공하는 AiKey가 소개되었습니다. 이 도구는 단순한 비용 모니터링을 넘어 워크플로우별 비용 효율성을 분석하고 제어할 수 있는 기능을 제공합니다.
We could see our AI bill, but not explain it — so I built AiKey↗indiehackers.com
Indie Hackers20일 전공공지능 분석AI 모델
21
마이크로소프트는 1.84 피터, 구글은 0.66. '피터' 단위는 무엇인가?
'The Peter'는 솔로 개발자 @steipete의 연간 깃허브 활동량을 1단위로 설정하여 기업의 커밋, PR, 이슈 생성량을 비교하는 새로운 벤치마크 도구입니다. 단순히 전체 활동량뿐만 아니라 기여도 대비 밀도를 측정함으로써, 대규모 조직의 인원수에 의한 착시 현상을 방지하고 조직의 진정한 개발 역량을 진단합니다.
Microsoft is 1.84 Peters, Google is 0.66. What's the Peter unit?↗github.com
Hacker News21일 전공공지능 분석AI 모델
22
Gemini CLI는 2026년 6월 18일부터 작동을 중단합니다.
구글은 2026년 6월 18일부로 Gemini CLI 서비스를 종료하고, 이를 차세대 에이전트 플랫폼인 'Antigravity CLI'로 통합한다고 발표했습니다. 이번 전환은 단일 작업 중심에서 여러 에이전트가 협업하는 멀티 에이전트 환경으로의 기술적 진화를 목표로 합니다.
Gemini CLI will stop working from June 18, 2026↗developers.googleblog.com
Hacker News21일 전공공지능 분석AI 모델
23
$5/월 DigitalOcean Droplet에서 Ollama + Nginx 로드 밸런싱으로 Llama 3.2 배포하기: Claude 비용의 1/160 수준의 멀티 인스턴스 추론
고가의 LLM API 대신 오픈소스 Llama 3.2를 저렴한 VPS 인프라에 분산 배포하여 추론 비용을 최대 160배 절감하는 기술적 방법을 제시합니다. Nginx를 로드 밸런서로 활용해 여러 개의 저사양 서버를 클러스터로 묶어 확장성과 안정성을 동시에 확보하는 것이 핵심입니다.
How to Deploy Llama 3.2 with Ollama + Nginx Load Balancing on a $5/Month DigitalOcean Droplet: Multi-Instance Inference at 1/160th Claude Cost↗dev.to
Dev.to WebDev21일 전공공지능 분석AI 모델