스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 05. 22. 오전 06:00 KST·총 24건

AI 모델 관련 글 — 23 페이지

0
2021년 맥북에서 젬마4-31B(50GB 스왑)로 동영상 1년 분량 로컬 인덱싱하기
영상 편집의 진짜 문제는 편집 도구의 부재가 아니라, 이름 없는 파일로 가득 찬 비정형 데이터의 검색 불가능성입니다. 작성자는 고가의 SaaS 대신 로컬 LLM과 기존 편집 툴을 결합하여, 영상의 메타데이터를 텍스트 파일로 자동 생성하는 'Local-first' 인덱싱 시스템을 구축해 비용 절감과 효율성을 동시에 달着했습니다.
Indexing a year of video locally on a 2021 MacBook with Gemma4-31B (50GB swap)↗blog.simbastack.com
Hacker News19일 전공공지능 분석AI 모델
1
48,000달러 상당의 GPU 서버, 괜찮은 선택이었나?
FAANG 퇴사 후 독립 연구자가 된 저자가 4만 8천 달러를 투자해 구축한 6개의 RTX 6000 Ada GPU 서버의 구축 과정과 경제성을 분석했습니다. 클라우드 GPU 대여 비용과 자체 서버 운영 비용을 비교한 결과, 높은 활용률을 전제로 하드웨어 소유가 유리할 수 있음을 보여줍니다.
Was my $48K GPU server worth it?↗rosmine.ai
Hacker News19일 전공공지능 분석AI 모델
2
AI 엔지니어링이 분산 시스템 엔지니어링과 유사해지는 이유
파운데이션 모델의 성능이 상향 평준화됨에 따라 AI 엔지니어링의 핵심 과제가 프롬프트 작성을 넘어 시스템의 안정성과 확장성을 관리하는 영역으로 확장되고 있습니다. 이제 AI 워크플로우는 단순한 모델 호출을 넘어 데이터 검색, 비동기 처리, 검증 등 복잡한 분산 시스템 구조를 갖추게 되었습니다.
Why AI Engineering Is Becoming More Like Distributed Systems Engineering↗dev.to
Dev.to AI19일 전공공지능 분석AI 모델
3
Claude Compliance API, Cloudflare CASB 지원 발표
Cloudflare가 자사의 CASB(Cloud Access Security Broker)에 Claude Compliance API를 통합하여, 기업 사용자의 Claude 프로젝트, 채팅 메시지, 첨부 파일 등을 에이전트 없이도 모니터링할 수 있게 되었습니다. 이를 통해 기업은 AI 활용 과정에서 발생할 수 있는 민감 데이터 유출 및 설정 오류를 방지하고 강력한 AI 거버넌스 환경을 구축할 수 있습니다.
Announcing Claude Compliance API support with Cloudflare CASB↗blog.cloudflare.com
Cloudflare Blog19일 전공공지능 분석AI 모델
4
토니 로빈스와 Calm 출신들이 설립한 The Path, 더 안전한 AI 치료 제공을 목표
명상 앱 Calm의 초기 멤버들이 설립한 'The Path'가 1,430만 달러 규모의 시드 펀딩을 성공적으로 완료했습니다. 이들은 기존 범용 LLM이 가진 '사용자 유지(Engagement) 중심'의 한계를 극복하고, 전문적인 심리 치료와 코칭을 위해 특화된 고도의 안전성을 갖춘 AI 모델을 통해 개인화된 정신 건강 케어를 제공하고자 합니다.
The Path, founded by Tony Robbins and Calm alums, hopes to offer safer AI therapy↗techcrunch.com
TechCrunch19일 전공공지능 분석AI 모델
5
멘타트, AI로 변호사 서면 작성 돕는다… “작성 시간 90% 단축”
멘타트는 변호사가 전략을 입력하면 소장 및 답변서 초안을 자동으로 생성하는 AI 에이전트 기반 서비스를 출시했습니다. 이 서비스는 대량의 사건 기록을 분석해 법원 제출 수준의 문서를 생성하며, FSD와 코파일럿 두 가지 모드를 통해 변호사의 업무 효율을 극대화합니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어19일 전공공지능 분석AI 모델
6
MinIO MemKV와 AI 재계산 비용: KV 캐시 오프로딩이 실제로 제공하는 가치
LLM 에이전트와 RAG 워크로드에서 발생하는 중복된 프롬프트 재계산 문제를 해결하기 위해, MinIO는 KV 캐시를 GPU 메모리 외부로 확장하여 저장하고 재사용하는 MemKV 기술을 선보였습니다. 이 기술은 적절한 인프라 조건 하에서 GPU 연산 효율을 극대화할 수 있는 잠재력을 가지고 있습니다.
MinIO MemKV and the AI Recompute Tax: What KV Cache Offloading Actually Buys You↗dev.to
Dev.to DevOps19일 전공공지능 분석AI 모델
7
Qwen 3.7 무료 사용법: 어떻게 해야 할까요?
알리바바가 에이전트 작업에 최적화된 Qwen 3.7-Max 및 Plus 프리뷰 모델을 출시했습니다. 현재 chat.qwen.ai와 모델 아레나를 통해 무료로 테스트할 수 있으며, 100만 토큰의 긴 컨텍스트 창을 지원하는 것이 특징입니다.
Como Usar Qwen 3.7 Grátis?↗dev.to
Dev.to AI19일 전공공지능 분석AI 모델
8
PromptLens 구축: 무료, 로컬 우선 LLM 프롬프트 평가 도구 (오픈 소스, 기여자 모집)
PromptLens는 LLM 프롬프트 응답을 가독성, 감성, 길이 등의 지표로 측면 비교할 수 있는 로컬 우선(Local-first) 평가 도구입니다. FastAPI와 Vanilla JS로 구축되어 데이터 유출 걱정 없이 로컬에서 모든 프로세스가 실행되며, 현재 새로운 메트릭과 모델 커넥터 추가를 위한 오픈소스 기여자를 모집 중입니다.
I built PromptLens — a free, local-first LLM prompt evaluation tool (open source, looking for contributors)↗dev.to
Dev.to OpenSource19일 전공공지능 분석AI 모델
9
800만 개의 무료 AI 토큰을 FreeLLMAPI 하나로 통합, OpenAI API 활용하기
FreeLLMAPI는 Gemini, Groq, Mistral 등 14개 이상의 AI 모델 제공업체의 무료 티어를 단일 API로 통합하여 사용할 수 있게 해주는 셀프 호스팅 프록시입니다. 자동 장애 조치와 세션 유지 기능을 통해 여러 API의 속도 제한을 우회하며, 기존 OpenAI SDK를 수정 없이 그대로 사용할 수 있는 것이 특징입니다.
Turn ~800M Free AI Tokens Into a Single OpenAI API with FreeLLMAPI↗dev.to
Dev.to OpenSource19일 전공공지능 분석AI 모델
10
도구 웹 구축하기
인디 개발자가 툴 탐색 시간을 줄이기 위해 구축한 AnyTools는 AI, 개발, 디자인 등 다양한 분야의 도구를 큐레이션하여 제공합니다. 실시간 GitHub 프로젝트 순위와 AI 프롬프트 라이브러리를 통해 최신 기술 트렌드를 한눈에 파악할 수 있는 것이 특징입니다.
I build a tools web↗indiehackers.com
Indie Hackers19일 전공공지능 분석AI 모델
11
클로드 사용 비용이 계속 증가하는 이유: 에이전트 워크플로우에서 발견된 3가지 토큰 누수 패턴
AI 에이전트 기반 서비스 운영 시 발생하는 비용 상승의 주범은 모델 가격 인상이 아닌 비효율적인 토큰 사용 패턴인 '토큰 누수'입니다. 본 글은 중복 호출, 컨텍스트 비대화, 재시도 폭풍이라는 세 가지 핵심 누수 경로를 정의하고, 이를 해결하기 위한 구체적인 기술적 대응 방안과 모니터링 체계를 제안합니다.
Why My Claude Costs Kept Rising (Even When Output Didn’t): 3 Token Leakage Patterns in Agent Workflows↗indiehackers.com
Indie Hackers19일 전공공지능 분석AI 모델
12
패스키, 디지털 자격 증명 등으로 인증 현대화하기
이 기사는 패스키와 FedCM API, 그리고 이메일 인증 프로토록(EVP)을 활용하여 사용자 인증 과정을 현대화하는 방법을 다룹니다. 인증 과정에서의 마찰을 줄임으로써 보안을 강화하고, pixiv의 사례처럼 로그인 성공률과 사용자 유지율을 획기적으로 높일 수 있는 전략을 제안합니다.
Modernize authentication with passkeys, digital credentials, and more↗developer.chrome.com
Chrome Developers19일 전공공지능 분석AI 모델
13
알리바바, AI 풀스택 업그레이드 발표…신규 LLM·AI칩·인프라 공개
알리바바 클라우드가 모델, 서비스, 칩, 인프라를 통합한 AI 풀스택 업그레이드를 공개했습니다. 에이전틱 코딩에 최적화된 Qwen3.7-Max 모델과 성능이 3배 향상된 Zhenwu M890 AI 가속기를 통해 강력한 AI 생태계를 구축하겠다는 전략입니다.
플래텀↗platum.kr
플래텀19일 전공공지능 분석AI 모델
14
LLM에 원시 스크래핑 데이터를 계속 넣지 마세요 (API 크레딧 낭비합니다)
LLM 기반 서비스를 구축할 때 가공되지 않은 HTML 데이터를 그대로 입력하면 토큰 비용이 급증하고 모델의 환각 현상이 심화됩니다. 이를 해결하기 위해 데이터 수집 단계에서부터 노이즈를 제거하고 구조화된 정보를 추출하는 '데이터 밀도(Data Density)' 최적화 전략이 필수적입니다.
Stop feeding raw scraped data to your LLMs (You're burning API credits)↗indiehackers.com
Indie Hackers19일 전공공지능 분석AI 모델
15
PopuLoRA: 추론을 위한 자기 학습 AI 집단 진화
PopuLoRA는 LLM의 추론 능력을 높이기 위해 교사(Task Generator)와 학생(Solver) 모델 집단을 분리하여 상호 학습시키는 비대칭 자기 학습 프레임워크입니다. 기존의 단일 모델 자기 학습이 난이도가 낮은 문제로 수렴하는 '커리큘럼 붕괴' 현상을 겪는 것과 달리, 이 방식은 학생이 풀지 못하는 어려운 문제를 교사가 생성하도록 유도하여 지속적인 학습 성장을 가능하게 합니다.
PopuLoRA: Co-Evolving LLM Populations for Reasoning Self- Play↗vmax.ai
Hacker News19일 전공공지능 분석AI 모델
16
앤스로픽, 콜로서스2로 확장, GB200 활용
앤스로픽은 6월 중 스페이스X와의 파트너십을 확대하여 '콜로서스 2' 인프라에서 클로드(Claude)의 추론 성능을 강화할 예정입니다. 이번 확장은 엔비디아의 차세대 칩인 GB200을 활용하며, 폭증하는 AI 수요에 대응하기 위한 물리적 인프라 확보의 중요성을 시사합니다.
Anthropic is expanding to Colossus2. Will use GB200↗xcancel.com
Hacker News19일 전공공지능 분석AI 모델
17
해셀 호환 재단 2026 업데이트
Haskell 재단은 기존의 행정 및 운영 중심 구조에서 벗어나, 재정 자원을 기술적 성과에 집중하기 위한 대대적인 구조 개편을 발표했습니다. 이를 위해 실행 이사직을 폐지하고 기술 위원회를 신설하며, 멤버들을 단순 기부자가 아닌 생태계의 주도적 파트너로 재정의할 계획입니다.
Haskell Foundation 2026 Update↗discourse.haskell.org
Hacker News19일 전공공지능 분석AI 모델
18
오늘의 AI & Tech 뉴스: 경량 모델, 과학적 돌파구, 그리고 Provenance 논쟁 (2026-05-21)
구글의 Gemini 3.5 Flash 출시와 OpenAI의 수학적 난제 해결을 통해 AI의 역할이 실시간 서비스와 심층 R&D로 확장되고 있습니다. 동시에 8B 규모의 소형 모델을 활용한 고정밀 에이전트 구현 기술이 등장하며 AI 운영 비용의 혁신적 절감 가능성을 보여주었습니다.
Today's AI & Tech Digest: Lightweight Models, Scientific Breakthroughs, and the Provenance Battle (2026-05-21)↗dev.to
Dev.to AI19일 전공공지능 분석AI 모델
19
Replicate에서 Zf-Kbot의 Image-Background-Remove 모델 사용법: 초보자 가이드
Zf-Kbot의 'Image-Background-Remove' 모델은 Replicate 인프라를 활용해 이미지 URL 입력만으로 배경이 제거된 결과물을 반환하는 간편한 도구입니다. 이 모델은 복잡한 설정 없이 이커머스 제품 사진 정리나 소셜 미디어 콘텐츠 제작 자동화에 최적화되어 있습니다.
A beginner's guide to the Image-Background-Remove model by Zf-Kbot on Replicate↗dev.to
Dev.to AI19일 전공공지능 분석AI 모델
20
HunyuanWorld 1.0: 단어나 픽셀로 몰입감 있고 탐험 가능하며 상호작용적인 3D 월드 생성
HunyuanWorld 1.0은 단어나 픽셀 입력을 통해 탐험 가능한 3D 월드를 생성하는 최신 AI 모델입니다. 단순한 3D 에셋 생성을 넘어, 사용자가 상호작용할 수 있는 완성된 가상 환경을 구축함으로써 콘텐츠 제작 패러다임을 바꿀 잠재력을 가졌습니다.
HunyuanWorld 1.0: Generating Immersive, Explorable, and Interactive 3D Worldsfrom Words or Pixels↗dev.to
Dev.to AI19일 전공공지능 분석AI 모델
21
Replicate에서 Zf-Kbot의 Invsr 모델 사용법: 초보자 가이드
Invsr는 확산 모델(Diffusion-based)을 활용하여 저해상도 이미지를 고품질로 복원하는 이미지 초해상도(Super-resolution) 모델입니다. 사용자는 샘플링 단계와 타일 크기 설정을 통해 이미지 품질과 메모리 효율성을 직접 제어할 수 있습니다.
A beginner's guide to the Invsr model by Zf-Kbot on Replicate↗dev.to
Dev.to AI19일 전공공지능 분석AI 모델
22
마키아토 데이 3, 4 & 5: 붉은 브루탈리즘, .sh 도메인, 그리고 클로드의 지표가 모니터를 부수게 만들 뻔했던 밤
이 글은 AI 비용 모니터링 도구인 Macchiato의 개발 과정을 담은 로그로, 불규칙한 Claude API의 토큰 사용량 데이터를 정확하게 추출하려는 기술적 도전과 기능성을 극대화한 브루탈리즘 디자인 적용 사례를 다룹니다. 개발자는 미적인 화려함 대신 엔지니어의 작업 환경에 최적화된 고밀도, 고성능 인터페이스 구축에 집중했습니다.
Macchiato Days 3, 4 & 5: Red Brutalism, a .sh Domain, and the Night Claude’s Metrics Nearly Made Me Smash My Monitor↗dev.to
Dev.to OpenSource19일 전공공지능 분석AI 모델
23
2026년 런타임 거버넌스 증거 앵커: 예산 및 책임 결정의 공개 장부
AI 시스템 운영 시 발생하는 장애 대응용 데이터와 재무 정산용 데이터의 불일치 문제를 해결하기 위해 '증거 <em>앵커(Evidence Anchor)</em>' 도입을 제안합니다. 단순한 모니터링을 넘어, 예산 임계치에 따른 정책 변화와 명확한 비용 주체 식별을 통해 실행 가능한 거버넌스 체계를 구축해야 한다고 강조합니다.
Runtime Governance Evidence Anchors in 2026: A Public Ledger for Budget and Accountability Decisions↗dev.to
Dev.to DevOps19일 전공공지능 분석AI 모델