AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 19 페이지
- 0
콜라보라, 경쟁이 치열해지는 오픈소스 클라우드 오피스 스위트 시장 속 CODE 26.04 출시
콜라보라는 최신 버전인 CODE 26.04를 통해 AI 기능(기본 비활성화)과 마크다운 지원, 스프레드시트 수식 오류 처리 개선 등 강력한 업데이트를 선보였습니다. 이는 리브레오피스 재단과의 경쟁 및 글로벌 디지털 주권 이슈와 맞물려 오픈소스 클라우드 오피스 시장의 점유율을 확보하기 위한 전략적 움직임입니다.
Collabora releases CODE 26.04 as rivalry between FOSS cloudy office suites heats up↗theregister.com
- 3
Hermes AI에서 PhotoGPT로 사실적인 사진 생성 – 개인 모델 지원 출시
Hermes AI에 출시된 PhotoGPT는 개인화된 모델을 활용해 실사 수준의 인물 사진을 생성할 수 있는 스킬로, 비동기 작업 폴링 방식을 통해 안정적인 이미지 생성을 지원합니다. 특히 생성된 이미지를 Azure Blob storage를 거쳐 Mural로 자동 업로드하는 워크플로우 통합 기능을 제공하여 콘텐츠 제작 프로세스의 효율성을 극대화합니다.
Generate Realistic Photos with PhotoGPT in Hermes AI — Now with Personal Model Support↗dev.to
- 8
5주 만에 로컬 모델이 당사 풀 리퀘스트 41건을 오픈했습니다. 모델은 가장 흥미롭지 않은 부분입니다.
LLMKube의 'Foreman' 에이전트는 고성능 클라우드 모델 대신 저사양 로컬 모델을 활용하면서도, 결정론적인 검증 루프를 통해 5주간 41건의 PR을 병합했습니다. 이 시스템은 모델의 불확실성을 제어하기 위해 코드 빌드, 범위 체크, 테스트 유효성 등 엄격한 가드레일을 구축하여 신뢰도를 확보했습니다.
A local model opened 41 of our pull requests in five weeks. The model is the least interesting part.↗dev.to
- 9
0.5달러/분 클로드 API 스택을 '증류의 왕' Qwen으로 대체하며 마이크로 SaaS를 구한 이유
Anthropic의 데이터 증류 의혹 속에서도 Qwen 등 중국계 AI 모델이 압도적인 가성비를 앞세워 시장 점유율을 넓히고 있습니다. 특히 에이전트 기반 서비스 개발자들은 비용 절감을 위해 PandasRouter와 같은 게이트웨이를 활용하여 저렴한 중국 모델을 효율적으로 통합하는 전략을 취하고 있습니다.
Why I Ditched My $0.50/M Claude API Stack for the "Distillation King" Qwen (And Saved My Micro-SaaS)↗indiehackers.com
- 11
Show HN: Dspyer – DSPy와 LangGraph를 위한 자체 수정 및 최적화 가능한 LLM 단계
dspyer는 개발자가 작성한 표준 파이썬 함수와 Pydantic 스키마를 DSPy 모듈로 변환하여, 프롬프트 자동 최적화 및 자가 수정(Self-correction) 기능을 제공합니다. 이를 통해 모델 교체 시 발생하는 프롬프트 붕괴 문제를 방지하고 에이전트의 신뢰성을 높일 수 있습니다.
Show HN: Dspyer – self-correcting, optimizable LLM steps for DSPy and LangGraph↗github.com
- 15
앤스로픽, 알리바바가 클로드 AI 모델 역추적 방식으로 불법 추출했다고 주장: 내부 분석 결과
Anthropic은 알리바바가 합법적인 API 접근을 통해 Claude의 추론 능력을 체계적으로 복제하는 '증류 공격(Distillation Attack)'을 수행했다고 주장했습니다. 이는 단순한 데이터 유출이 아닌, 모델의 지능 자체를 산업적 규모로 탈취하려는 시도로 규정됩니다.
Anthropic Says Alibaba Illicitly Extracted Claude AI Model Capabilities: Inside the Distillation Drain↗dev.to
- 19
지식 관리 시스템이 콘텐츠 공장이 될 때: 당신만이 유일한 고객인 69번째 시도
개발자가 6년간 개인 지식 관리 시스템인 'Papers'를 구축하며 겪은 세 단계의 시행착오를 다룹니다. AI 임베딩과 복잡한 데이터베이스 인덱싱을 거쳐, 결국 가장 단순한 텍스트 검색이 가장 빠르고 정확하다는 결론에 도달하는 과정을 보여줍니다.
The 69th Attempt: When Your Knowledge Management System Becomes a Content Factory (But You're The Only Customer)↗dev.to
- 20
LLM 페일오버 vs 검증된 페일오버: API 전환만으로는 충분하지 않은 이유
기존 LLM API 페일오버는 서비스 중단은 감지하지만, 응답 잘림이나 스키마 변경 같은 '정상 응답으로 위장한 오류'를 잡아내지 못하는 한계가 있습니다. `correctover`는 6가지 차원의 계약(Contract)을 통해 백업 공급자의 응답이 사전에 정의된 품질 기준을 충족하는지 검증하여 시스템의 신뢰성을 보장합니다.
LLM Failover vs Verified Failover: Why Switching APIs Is Not Enough↗dev.to
- 21
Correctover: LLM API를 위한 검증된 페일오버 SDK - 완벽 가이드
Correctover는 기존 프록시 게이트웨이 방식의 한계를 극복하기 위해 개발된 '검증된 페일오버(Verified Failover)' SDK입니다. 응답의 스키마, 지연시간, 비용 등을 실시간으로 검증하여 유효한 응답만을 전달하며, 사용자 프로세스 내에서 실행되어 데이터 보안과 저지연성을 동시에 확보했습니다.
Correctover: The Verified Failover SDK for LLM APIs — Complete Product Guide↗dev.to
- 22
마케팅 신화는 넘어, 프로덕션 환경에서의 프록시 네트워크 성능 벤치마크 및 신뢰성 감사
프록시 제공업체의 마케팅 수치와 실제 데이터 수집 환경에서의 성능 차이를 비교 분석한 글입니다. Oxylabs, Bright Data, SmartProxy의 응답 속도와 성공률을 비교하며, 효율적인 이커<0xA5>머스 모니터링을 위한 세션 관리 및 풀 분리 전략을 제안합니다.
Beyond Marketing Myths: Proxy Network Performance Benchmarks & Reliability Auditing in Production↗dev.to













