스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 06. 25. 오후 08:47 KST·총 24건

AI 모델 관련 글 — 19 페이지

0
콜라보라, 경쟁이 치열해지는 오픈소스 클라우드 오피스 스위트 시장 속 CODE 26.04 출시
콜라보라는 최신 버전인 CODE 26.04를 통해 AI 기능(기본 비활성화)과 마크다운 지원, 스프레드시트 수식 오류 처리 개선 등 강력한 업데이트를 선보였습니다. 이는 리브레오피스 재단과의 경쟁 및 글로벌 디지털 주권 이슈와 맞물려 오픈소스 클라우드 오피스 시장의 점유율을 확보하기 위한 전략적 움직임입니다.
Collabora releases CODE 26.04 as rivalry between FOSS cloudy office suites heats up↗theregister.com
The Register7일 전공공지능 분석AI 모델
1
ZTE, 토큰 경제 활성화를 위한 최적의 TCO를 갖춘 AI 팩토리 구축
ZTE는 GPU, CPU, 스위치 칩을 유연하게 교체할 수 있는 OEX 아키텍처를 통해 대규모 AI 추론에 최적화된 SuperPOD를 선보였습니다. 이 솔루션은 하드웨어-소프트웨어 시너지를 통해 토큰 생성 속도(TPS)를 높이고, 데이터 전송 지연을 최소화하여 효율적인 '토큰 경제' 구축을 지원합니다.
ZTE builds a TCO-optimal AI factory to fuel token economy↗theregister.com
The Register7일 전공공지능 분석AI 모델
2
오픈 웨이트 모델의 견딜 수 없는 저렴함
DeepSeek V4가 기존 프론티어 모델 대비 최대 50배 저렴한 비용을 제시하며 AI 시장의 가격 파괴를 주도하고 있습니다. 이에 따라 폐쇄형 모델 기업들은 프리미엄 브랜드 전략과 규제를 통한 진입 장벽 구축을 고민하는 반면, 오픈 웨이트 및 진정한 오픈 소스 모델은 기술적 확산을 가속화하고 있습니다.
The Unbearable Cheapness of Open Weight Models↗jamesoclaire.com
Hacker News7일 전공공지능 분석AI 모델
3
Hermes AI에서 PhotoGPT로 사실적인 사진 생성 – 개인 모델 지원 출시
Hermes AI에 출시된 PhotoGPT는 개인화된 모델을 활용해 실사 수준의 인물 사진을 생성할 수 있는 스킬로, 비동기 작업 폴링 방식을 통해 안정적인 이미지 생성을 지원합니다. 특히 생성된 이미지를 Azure Blob storage를 거쳐 Mural로 자동 업로드하는 워크플로우 통합 기능을 제공하여 콘텐츠 제작 프로세스의 효율성을 극대화합니다.
Generate Realistic Photos with PhotoGPT in Hermes AI — Now with Personal Model Support↗dev.to
Dev.to AI7일 전공공지능 분석AI 모델
4
GA 분석: Gemini 모델 에이전트와 상호작용 API
구글의 Gemini Interactions API가 정식 출시(GA)되어 상태 관리, 배경 실행, 도구 조합을 지원하는 단일 통합 엔드포인트로 자리 잡았습니다. 이는 기존 LangGraph나 CrewAI 같은 오케스트레이션 프레임워크의 역할을 클라우드 플랫폼이 직접 흡수하며 개발 복잡도를 획기적으로 낮추는 것을 의미합니다.
Interactions API Gemini Models Agents: The GA Breakdown↗dev.to
Dev.to AI7일 전공공지능 분석AI 모델
5
자가 치유 vs. 온콜: 90초 안에 루프를 닫다
기존의 온콜 방식은 엔지니어의 개입으로 인한 필연적인 지연 시간 때문에 서비스 장애를 장기화시키는 구조적 결함을 가지고 있습니다. 진정한 자가 치점(Self-healing)을 위해서는 탐지, 진단, 실행, 검증의 전 과정이 90초 이내에 사람 없이 완료되는 자동화된 루프 폐쇄가 필요합니다.
Self-healing vs. on-call closing the loop in under 90 seconds↗dev.to
Dev.to DevOps7일 전공공지능 분석AI 모델
6
환각 점수: AI의 신뢰성을 유지하는 4가지 평가
AI 모델의 '전체 정확도'는 특정 위험 영역에서의 오류를 은폐할 수 있어, EU AI Act와 같은 글로벌 규제 대응을 위해서는 정밀한 평가 지점(Granual metrics)이 필요합니다. 본 기사는 환각 방지와 신뢰성 확보를 위한 4가지 핵심 평가 지표의 정의와 구현 전략을 다룹니다.
Hallucination Scoring: The 4 Evaluations That Keep AI Trustworthy↗dev.to
Dev.to AI7일 전공공지능 분석AI 모델
7
AI가 생각할 때 단순함이 복잡함을 이긴다 - MCP 지식
기존의 복잡한 RAG(검색 증강 생성) 시스템 대신 MCP를 도입하여 서버의 역할을 단순 데이터 제공으로 축소하고, AI 클라이언트가 직접 데이터를 판단하게 함으로써 유지보수 비용과 개발 복잡성을 획기적으로 줄이는 방법을 설명한다. 임베딩이나 벡터 DB 없이 단순 문자열 검색만으로도 높은 성능을 낼 수 있음을 강조한다.
# MCP Knowledge: Simple Beats Complex When AI Thinks↗dev.to
Dev.to OpenSource7일 전공공지능 분석AI 모델
8
5주 만에 로컬 모델이 당사 풀 리퀘스트 41건을 오픈했습니다. 모델은 가장 흥미롭지 않은 부분입니다.
LLMKube의 'Foreman' 에이전트는 고성능 클라우드 모델 대신 저사양 로컬 모델을 활용하면서도, 결정론적인 검증 루프를 통해 5주간 41건의 PR을 병합했습니다. 이 시스템은 모델의 불확실성을 제어하기 위해 코드 빌드, 범위 체크, 테스트 유효성 등 엄격한 가드레일을 구축하여 신뢰도를 확보했습니다.
A local model opened 41 of our pull requests in five weeks. The model is the least interesting part.↗dev.to
Dev.to OpenSource7일 전공공지능 분석AI 모델
9
0.5달러/분 클로드 API 스택을 '증류의 왕' Qwen으로 대체하며 마이크로 SaaS를 구한 이유
Anthropic의 데이터 증류 의혹 속에서도 Qwen 등 중국계 AI 모델이 압도적인 가성비를 앞세워 시장 점유율을 넓히고 있습니다. 특히 에이전트 기반 서비스 개발자들은 비용 절감을 위해 PandasRouter와 같은 게이트웨이를 활용하여 저렴한 중국 모델을 효율적으로 통합하는 전략을 취하고 있습니다.
Why I Ditched My $0.50/M Claude API Stack for the "Distillation King" Qwen (And Saved My Micro-SaaS)↗indiehackers.com
Indie Hackers7일 전공공지능 분석AI 모델
10
Gemini Spark
Gemini Spark는 사용자의 지시 하에 24시간 중단 없이 작동하는 개인용 AI 에이전트 서비스입니다. 기기 전원이 꺼진 상태에서도 백그라운드에서 자율적으로 업무를 수행하며, 주요 작업 전에는 사용자 확인을 거치는 안전 장치를 갖추고 있습니다.
Product Hunt↗producthunt.com
Product Hunt7일 전공공지능 분석AI 모델
11
Show HN: Dspyer – DSPy와 LangGraph를 위한 자체 수정 및 최적화 가능한 LLM 단계
dspyer는 개발자가 작성한 표준 파이썬 함수와 Pydantic 스키마를 DSPy 모듈로 변환하여, 프롬프트 자동 최적화 및 자가 수정(Self-correction) 기능을 제공합니다. 이를 통해 모델 교체 시 발생하는 프롬프트 붕괴 문제를 방지하고 에이전트의 신뢰성을 높일 수 있습니다.
Show HN: Dspyer – self-correcting, optimizable LLM steps for DSPy and LangGraph↗github.com
Hacker News Show7일 전공공지능 분석AI 모델
12
LLM 코드 스타일과 토큰 비용에 대해 발견한 점
LLM은 학습 데이터의 영향으로 현대적인 Web API 대신 길고 복잡한 구식 Node.js 패턴을 생성하는 경향이 있으며, 이는 출력 토큰 비용을 불필요하게 높입니다. 개발자가 Deno나 Cloudflare Workers와 같은 최신 런타임의 네이티브 기능을 사용하도록 프롬프트에 명시함으로써 코드 품질을 높이고 운영 비용을 절감할 수 있습니다.
What I'm Finding About LLM Code Style and Token Costs↗jimmont.com
Hacker News7일 전공공지능 분석AI 모델
13
GLM-5.2, 오픈 에이전트의 혁신적인 도약
Z.ai의 최신 오픈 웨이트 모델 GLM-5.2가 코딩 및 범용 에이전트 성능에서 Claude Fable 5를 능가하는 놀라운 성과를 보여주며 업계의 주목을 받고 있습니다. 이 모델은 단순한 업데이트를 넘어, 고도화된 추론 기능을 갖춘 오픈 소스 모델이 폐쇄형 모델의 강력한 대안이 될 수 있음을 증명했습니다.
GLM-5.2 is a step change for open agents↗interconnects.ai
Hacker News7일 전공공지능 분석AI 모델
14
Pangram 3.3.2의 내부 표현 탐구
Pangram Labs는 최신 AI 텍스트 탐지 모델인 Pangram 3.3.2의 내부 작동 원리를 규명하기 위한 해석 가능성 연구를 진행 중입니다. 이들은 단순한 통계적 지표 대신 LLM의 내부 활성화 벡터를 PCA, UMAP 등의 차원 축소 기법으로 분석하여 AI 생성물과 인간 작성물의 특징을 심층적으로 파악하고자 합니다.
Exploring the internal representations of Pangram 3.3.2↗pangram.com
Hacker News7일 전공공지능 분석AI 모델
15
앤스로픽, 알리바바가 클로드 AI 모델 역추적 방식으로 불법 추출했다고 주장: 내부 분석 결과
Anthropic은 알리바바가 합법적인 API 접근을 통해 Claude의 추론 능력을 체계적으로 복제하는 '증류 공격(Distillation Attack)'을 수행했다고 주장했습니다. 이는 단순한 데이터 유출이 아닌, 모델의 지능 자체를 산업적 규모로 탈취하려는 시도로 규정됩니다.
Anthropic Says Alibaba Illicitly Extracted Claude AI Model Capabilities: Inside the Distillation Drain↗dev.to
Dev.to AI7일 전공공지능 분석AI 모델
16
N개의 그린 체크가 1비트일 수 있다: 실제로 검증 가능한 독립성을 세는 방법
여러 개의 검증 프로세스가 존재하더라도 동일한 입력값이나 기반 모델을 공유한다면 이는 단일 정보와 다름없다는 점을 지적합니다. 진정한 신뢰를 구축하기 위해서는 에이전트의 다양성이 아닌, 서로 인과관계가 없는 독립적인 증거(evidence)를 확보하는 것이 핵심입니다.
N Green Checks Can Be One Bit: Counting Independence You Can Actually Check↗dev.to
Dev.to AI7일 전공공지능 분석AI 모델
17
LLM은 어디에 들어맞는가?
LLM을 리스크 판단의 주체로 사용하는 것은 모호한 언어만을 생성하여 신뢰성을 떨어뜨리는 잘못된 접근입니다. 정확한 수치를 산출하는 모델, 규칙에 따라 행동을 결정하는 로직, 그리고 이를 인간이 이해하기 쉽게 설명하는 LLM으로 역할을 분리하는 구조적 설계가 필요합니다.
Where Does the LLM Fit?↗dev.to
Dev.to AI7일 전공공지능 분석AI 모델
18
엉성한 텍스트 추출은 이제 그만: Mistral OCR 4가 문서 AI를 쓸모있게 만들었다 🤯
Mistral OCR 4는 텍스트뿐만 아니라 표, 서식, 좌표값 및 신뢰도 점수를 제공하여 문서의 구조적 의미를 완벽하게 보존합니다. 이를 통해 고품질의 RAG 구축이 가능하며, 저렴한 비용과 셀프 호스팅 지원으로 기업용 AI 솔루션에 최적화된 기능을 제공합니다.
Stop Using Dumb Text Extraction: Mistral OCR 4 Just Made Document AI Actually Useful 🤯↗dev.to
Dev.to AI7일 전공공지능 분석AI 모델
19
지식 관리 시스템이 콘텐츠 공장이 될 때: 당신만이 유일한 고객인 69번째 시도
개발자가 6년간 개인 지식 관리 시스템인 'Papers'를 구축하며 겪은 세 단계의 시행착오를 다룹니다. AI 임베딩과 복잡한 데이터베이스 인덱싱을 거쳐, 결국 가장 단순한 텍스트 검색이 가장 빠르고 정확하다는 결론에 도달하는 과정을 보여줍니다.
The 69th Attempt: When Your Knowledge Management System Becomes a Content Factory (But You're The Only Customer)↗dev.to
Dev.to OpenSource7일 전공공지능 분석AI 모델
20
LLM 페일오버 vs 검증된 페일오버: API 전환만으로는 충분하지 않은 이유
기존 LLM API 페일오버는 서비스 중단은 감지하지만, 응답 잘림이나 스키마 변경 같은 '정상 응답으로 위장한 오류'를 잡아내지 못하는 한계가 있습니다. `correctover`는 6가지 차원의 계약(Contract)을 통해 백업 공급자의 응답이 사전에 정의된 품질 기준을 충족하는지 검증하여 시스템의 신뢰성을 보장합니다.
LLM Failover vs Verified Failover: Why Switching APIs Is Not Enough↗dev.to
Dev.to DevOps7일 전공공지능 분석AI 모델
21
Correctover: LLM API를 위한 검증된 페일오버 SDK - 완벽 가이드
Correctover는 기존 프록시 게이트웨이 방식의 한계를 극복하기 위해 개발된 '검증된 페일오버(Verified Failover)' SDK입니다. 응답의 스키마, 지연시간, 비용 등을 실시간으로 검증하여 유효한 응답만을 전달하며, 사용자 프로세스 내에서 실행되어 데이터 보안과 저지연성을 동시에 확보했습니다.
Correctover: The Verified Failover SDK for LLM APIs — Complete Product Guide↗dev.to
Dev.to OpenSource7일 전공공지능 분석AI 모델
22
마케팅 신화는 넘어, 프로덕션 환경에서의 프록시 네트워크 성능 벤치마크 및 신뢰성 감사
프록시 제공업체의 마케팅 수치와 실제 데이터 수집 환경에서의 성능 차이를 비교 분석한 글입니다. Oxylabs, Bright Data, SmartProxy의 응답 속도와 성공률을 비교하며, 효율적인 이커<0xA5>머스 모니터링을 위한 세션 관리 및 풀 분리 전략을 제안합니다.
Beyond Marketing Myths: Proxy Network Performance Benchmarks & Reliability Auditing in Production↗dev.to
Dev.to DevOps7일 전공공지능 분석AI 모델
23
OpenAI와 Broadcom, 대규모 LLM 추론을 위한 칩 발표
OpenAI와 Broadcom이 대규모 언어 모델(LLM) 추론에 특화된 새로운 ASIC 칩인 'Jalapeño'를 공동 발표했습니다. 이 칩은 기존 시스템보다 높은 전력 대비 성능을 목표로 하며, 올해 말부터 데이터 센터에 배치될 예정입니다.
OpenAI and Broadcom announce chip designed for LLM inference at scale↗arstechnica.com
Ars Technica7일 전공공지능 분석AI 모델