AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 24 페이지
- 1
Show HN: IgniteMS – 8x A100에서 초당 253K 메시지 처리량의 일괄 텍스트 임베딩
IgniteMS는 Python 런타임 없이 Rust와 TensorRT를 사용하여 텍스트 임베딩 속도를 극대화한 엔진입니다. 대규모 벡터 DB 재색인이나 코퍼스 규모의 데이터 처리에 최적화되어 있으며, OpenAI API 대비 약 136배 저렴한 비용으로 대량의 데이터를 처리할 수 있는 경제성을 갖췄습니다.
Show HN: IgniteMS – batch text embeddings at 253K msg/s on 8x A100↗github.com
- 10
2026년 AI 비용 귀속 증거 고정: 재할당 없이 테넌트 과금 환불 분쟁 해결 방법
AI 테넌트별 비용 배분(Chargeback) 분쟁은 주로 데이터의 추적 불가능성 때문에 발생하며, 이는 배분 공식의 문제가 아닌 증거의 연속성 문제입니다. 이를 해결하기 위해 재검토자가 결과값을 재현할 수 있도록 6가지 핵심 필드를 포함한 '최소 증거 앵커'를 구축하여 데이터의 신뢰성을 확보해야 합니다.
AI Cost Attribution Evidence Anchors in 2026: How to Close Tenant Chargeback Disputes Without Re-running Allocation↗dev.to
- 13
OUKC: AI 친화적인 다국어 세계관 공통 기반 (창립 문서) - Paper 144 v0.3.1
OUKC는 AI가 논리적 구조를 직접 이해하고 검증할 수 있도록 기계 판독 가능한 고밀도 지식 체계를 구축하는 프로젝트입니다. Lean 4 기반의 형식 증명과 재현 가능한 검증 메커니즘을 통해, 단순한 정보 전달을 넘어 학문적 깊이를 보존하는 AI 친화적 지식 생태계 구축을 목표로 합니다.
Paper 144 v0.3.1 — OUKC: An AI-Friendly Multilingual Worldview Commons (Founding Document)↗dev.to
- 17
Stability AI, 6분 길이의 노래를 만들 수 있는 새로운 오디오 모델 출시
Stability AI가 최대 6분 20초 길이의 음악을 생성할 수 있는 새로운 오디오 모델인 Stability Audio 3.0을 공개했습니다. 이번 모델군은 온디바이스용 소형 모델부터 API 전용 대형 모델까지 포함하며, 특히 음악 레이블과 정식 계약된 라이선스 데이터를 사용하여 저작권 리스크를 최소화한 것이 특징입니다.
Stability AI releases a new audio model that can create 6-minute songs↗techcrunch.com
- 20
인포마니악, 사용자 데이터 개인 정보 보호를 위해 기반 모델로 전환
스위스의 클라우드 서비스 기업 인포마니악은 창업주 보리스 지겐탈러가 의결권 과반을 공익 재단에 이전함으로써 기업의 핵심 가치인 프라이버시와 환경 책임을 영구적으로 보장하기로 했습니다. 이번 결정은 외부 투자자나 인수합병 시도에 관계없이 기업의 정체성을 유지하고 디지털 주권을 수호하기 위한 구조적 장치를 마련한 것입니다.
Infomaniak transitions to a foundation model to protect user data privacy↗news.infomaniak.com
- 23
Gemini Nano 온디바이스 함수 호출, Android 지원
이 글은 Gemini Nano의 온디바이스 함수 호출 기능을 사용하여 인터넷 연결 없이도 작동하는 안드로이드 AI 에이전트 구축 방법을 설명합니다. 32K라는 제한된 토큰 예산을 효율적으로 관리하는 스키마 최적화 기법과 모델의 환각 현상을 방지하기 위한 3단계 검증 파이프라인, 그리고 Room과 WorkManager를 이용한 오프라인 작업 큐잉 아키텍처를 제시합니다.
Gemini Nano On-Device Function Calling for Android↗dev.to

















