AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 25 페이지
- 2
OUKC: AI 친화적인 다국어 세계관 공통 기반 (창립 문서) - Paper 144 v0.3.1
OUKC는 AI가 논리적 구조를 직접 이해하고 검증할 수 있도록 기계 판독 가능한 고밀도 지식 체계를 구축하는 프로젝트입니다. Lean 4 기반의 형식 증명과 재현 가능한 검증 메커니즘을 통해, 단순한 정보 전달을 넘어 학문적 깊이를 보존하는 AI 친화적 지식 생태계 구축을 목표로 합니다.
Paper 144 v0.3.1 — OUKC: An AI-Friendly Multilingual Worldview Commons (Founding Document)↗dev.to
- 6
Stability AI, 6분 길이의 노래를 만들 수 있는 새로운 오디오 모델 출시
Stability AI가 최대 6분 20초 길이의 음악을 생성할 수 있는 새로운 오디오 모델인 Stability Audio 3.0을 공개했습니다. 이번 모델군은 온디바이스용 소형 모델부터 API 전용 대형 모델까지 포함하며, 특히 음악 레이블과 정식 계약된 라이선스 데이터를 사용하여 저작권 리스크를 최소화한 것이 특징입니다.
Stability AI releases a new audio model that can create 6-minute songs↗techcrunch.com
- 9
인포마니악, 사용자 데이터 개인 정보 보호를 위해 기반 모델로 전환
스위스의 클라우드 서비스 기업 인포마니악은 창업주 보리스 지겐탈러가 의결권 과반을 공익 재단에 이전함으로써 기업의 핵심 가치인 프라이버시와 환경 책임을 영구적으로 보장하기로 했습니다. 이번 결정은 외부 투자자나 인수합병 시도에 관계없이 기업의 정체성을 유지하고 디지털 주권을 수호하기 위한 구조적 장치를 마련한 것입니다.
Infomaniak transitions to a foundation model to protect user data privacy↗news.infomaniak.com
- 12
Gemini Nano 온디바이스 함수 호출, Android 지원
이 글은 Gemini Nano의 온디바이스 함수 호출 기능을 사용하여 인터넷 연결 없이도 작동하는 안드로이드 AI 에이전트 구축 방법을 설명합니다. 32K라는 제한된 토큰 예산을 효율적으로 관리하는 스키마 최적화 기법과 모델의 환각 현상을 방지하기 위한 3단계 검증 파이프라인, 그리고 Room과 WorkManager를 이용한 오프라인 작업 큐잉 아키텍처를 제시합니다.
Gemini Nano On-Device Function Calling for Android↗dev.to
- 13
인도네시아에서 14일 만에 조작 방지 AI 감사 추적 API를 구축했습니다. EU AI Act 시행까지 72일. 제가 얻은 교훈은 다음과 같습니다.
인도네시아의 18세 개발자가 AI 결정 과정을 해시 체인으로 기록하고 글로벌 규제 준수 여부를 확인하는 API 'AIDAL'을 14일 만에 개발했습니다. 그는 단순한 규제 가이드라인 제공을 넘어, 데이터의 무결성을 수학적으로 증명할 수 있는 기술적 인프라를 구축함으로써 규제 준수의 실질적인 해결책을 제시하고 있습니다.
I built a tamper-proof AI audit trail API in 14 days from Indonesia. 72 days until EU AI Act. Here's what I learned.↗indiehackers.com
- 19
Claude에게 Meta Ads 데이터를 직접 접근할 수 있는 권한을 부여하여 보고서 다운로드 작업을 중단하세요
Smacient는 Claude에 Meta Ads 계정 접근 권한을 부여하여 실시간 광고 성과 분석을 가능하게 하는 MCP 커넥터입니다. 사용자는 별도의 데이터 다운로드나 복사-붙여넣기 없이 광고 캠페인, 소재 성과, 타겟 오디언스 및 예산 최적화 제안을 AI를 통해 즉각적으로 확인할 수 있습니다.
We gave Claude direct access to Meta Ads data so you can stop downloading reports↗indiehackers.com
- 20
AI 청구서는 확인할 수 있지만 설명할 수 없어서, AiKey를 만들었어요
AI 서비스 운영 시 발생하는 비용 급증의 원인(중복 호출, 컨텍스트 과부하, 재시도 폭풍 등)을 파악하기 어렵다는 문제를 해결하기 위해, 요청 단위의 비용 귀속과 거버넌스를 제공하는 AiKey가 소개되었습니다. 이 도구는 단순한 비용 모니터링을 넘어 워크플로우별 비용 효율성을 분석하고 제어할 수 있는 기능을 제공합니다.
We could see our AI bill, but not explain it — so I built AiKey↗indiehackers.com
- 23
$5/월 DigitalOcean Droplet에서 Ollama + Nginx 로드 밸런싱으로 Llama 3.2 배포하기: Claude 비용의 1/160 수준의 멀티 인스턴스 추론
고가의 LLM API 대신 오픈소스 Llama 3.2를 저렴한 VPS 인프라에 분산 배포하여 추론 비용을 최대 160배 절감하는 기술적 방법을 제시합니다. Nginx를 로드 밸런서로 활용해 여러 개의 저사양 서버를 클러스터로 묶어 확장성과 안정성을 동시에 확보하는 것이 핵심입니다.
How to Deploy Llama 3.2 with Ollama + Nginx Load Balancing on a $5/Month DigitalOcean Droplet: Multi-Instance Inference at 1/160th Claude Cost↗dev.to















