스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 05. 19. 오전 02:35 KST·총 24건

AI 모델 관련 글 — 30 페이지

0
AI를 너무 쉽게 믿는 인간 심리
AI는 자신감 있고 유창한 대화 능력을 통해 실제 이해도와 상관없이 사용자에게 지능적이라는 착각을 불러일으킵니다. 이러한 '유창성의 함정'은 환각 현상을 식별하기 어렵게 만들며, AI가 사회적 상호작용의 대상으로 인식됨에 따라 보안 및 안전성 리스크를 증대시킵니다.
Why Humans Trust AI Too Easily↗dev.to
Dev.to OpenSource22일 전공공지능 분석AI 모델
1
오디세이의 Starchild-1
오디세이가 실시간 오디오와 비디오를 동시에 생성하는 멀티모달 월드 모델 'Starchild-1'을 공개했습니다. 이 모델은 사용자 입력에 즉각적으로 반응하여 동기화된 시청각 데이터를 생성하며, 게임, 로보틱스, 교육 등 다양한 산업에 몰입형 AI 경험을 제공하는 것을 목표로 합니다.
Starchild-1 by Odyssey↗producthunt.com
Product Hunt22일 전공공지능 분석AI 모델
2
Brew
Brew는 자연어 입력을 통해 이메일 카피, 디자인, 타겟팅, 자동화 로직을 단 몇 초 만에 구축해 주는 AI 이메일 마케팅 솔루션입니다. 기존 ESP(이메일 서비스 제공업체)로의 내보내기 기능을 지원하며, 다양한 AI 에이전트와 연동되어 워크플로우의 유연성을 극대화한 것이 특징입니다.
Product Hunt↗producthunt.com
Product Hunt22일 전공공지능 분석AI 모델
3
제로데이 공장: Anthropic의 ‘Mythos’와 코드 보안의 종말
Anthropic이 공개한 Claude Mythos는 코드의 구조적 결함을 분석하여 수십 년 된 오픈소스 취약점까지 찾아내는 강력한 보안 AI 모델입니다. 현재 'Project Glasswing'이라는 방어적 동맹을 통해 엄격히 통제되고 있으며, 이는 보안의 패러다임을 자동화된 공격과 방어의 시대로 전환시키고 있습니다.
The Zero-Day Factory: Anthropic’s ‘Mythos’ and the End of Code Security↗dev.to
Dev.to AI23일 전공공지능 분석AI 모델
4
Krea 2
Krea가 이미지 및 비디오 생성을 위한 새로운 자체 모델인 'Krea 2'를 공개했습니다. 이 모델은 미적 다양성과 스타일 제어, 무드보드 제작에 최적화되어 창작자의 의도를 정교하게 반영하는 워크플로우를 제공합니다.
Product Hunt↗producthunt.com
Product Hunt23일 전공공지능 분석AI 모델
5
“탄소 데이터도 AI가 관리한다”…리뉴어스랩, TIPS 선정으로 공급망 탄소회계 고도화
리뉴어스랩이 중기부 TIPS 프로그램에 최종 선정되어 AI 기반 공급망 탄소 데이터 자동 추출 및 검증 기술의 고도화를 추진합니다. OCR과 자체 파인튜닝 LLM을 결합해 탄소 데이터 준비 시간을 최대 80% 단축하며, 자동차 부품사를 중심으로 탄소 회계 SaaS인 'CarbonLink'를 확대하고 있습니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어23일 전공공지능 분석AI 모델
6
“병원 흩어진 진료기록, AI로 통합 관리”…룰루메딕, 의료 마이데이터 플랫폼 본격 가동
룰루메딕이 AWS 인프라를 기반으로 환자의 진료, 검사, 처방 기록을 통합 관리하는 차세대 의료 마이데이터 플랫폼 '디스탯'을 출시했습니다. 업스테이지와 공동 개발한 의료 특화 LLM을 활용하며, 강력한 보안 체계와 무저장 아키텍처를 통해 의료 데이터 활용의 핵심 과제인 보안 및 규제 문제를 해결하고자 합니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어23일 전공공지능 분석AI 모델
7
AI 기반 전환율을 높이는 영업 파이프라인 구축 방법
기존 AI 영업 도구들이 범용적인 텍스트 생성에 그쳐 외면받는 이유는 기업의 실제 비즈니스 맥락과 데이터가 결여되었기 때문입니다. 진정한 AI 영업 시스템은 CRM, 외부 데이터, 제품 분석 데이터를 통합하여 정교한 리드 점수화와 개인화된 아웃리치를 구현하는 데이터 파이프라인 구축에서 시작됩니다.
How We Built an AI-Powered Sales Pipeline That Actually Converts↗dev.to
Dev.to AI23일 전공공지능 분석AI 모델
8
RAG 시리즈 (19): 점진적 업데이트 - 지식 기반을 최신 상태로 유지하기
데이터가 지속적으로 변하는 실제 운영 환경에서 RAG 인덱스를 효율적으로 관리하는 점진적 업데이트(Incremental Update) 방법을 다룹니다. LangChain의 Indexing API를 활용해 해시 값을 비교함으로써, 변경된 문서만 임베팅하고 삭제된 문서를 정리하여 비용과 시간을 최적화하는 구체적인 구현 방안을 제시합니다.
RAG Series (19): Incremental Updates — Keeping the Knowledge Base Fresh↗dev.to
Dev.to AI23일 전공공지능 분석AI 모델
9
4가지 LLM 간 자동 라우팅 시도 결과, 우리가 얻은 교훈
이 기사는 DeepSeek, Kimi, MiniMax, Qwen 등 4가지 LLM을 작업 성격에 따라 분배하는 라우팅 시스템의 실험 결과를 다룹니다. 긴 문맥은 Kimi, 추론은 Qwen, 일반 채팅은 DeepSeek로 배분함으로써 비용을 최대 50% 절감하면서도 성능 저하 없이 효율적인 운영이 가능함을 보여줍니다.
We tried routing between 4 different LLMs automatically – here's what we learned↗dev.to
Dev.to AI23일 전공공지능 분석AI 모델
10
APIDot: AI 모델 개발 가속화하는 새로운 API 플랫폼
APIDot은 OpenAI, Google, ByteDance 등 다양한 AI 모델을 단일 API로 연결해주는 통합 플랫폼입니다. 개발자는 여러 벤더를 개별적으로 관리할 필요 없이 일관된 인터페이스를 통해 멀티모달 AI 기능을 빠르고 저렴하게 구현할 수 있습니다.
APIDot↗dev.to
Dev.to AI23일 전공공지능 분석AI 모델
11
$5/월 DigitalOcean Droplet에서 Llama 2 자체 호스팅: 완벽 설정 가이드
이 글은 DigitalOcean의 저가형 Droplet을 활용하여 LESS(Llama 2 7B) 모델을 4비트 양자화 방식으로 구축하는 방법을 설명합니다. 고가의 LLM API 대신 자체 인프라를 구축함으로써 대규모 요청 처리 시 발생하는 비용을 극적으로 줄이는 전략을 다룹니다.
Self-Host Llama 2 on a $5/Month DigitalOcean Droplet: Complete Setup Guide↗dev.to
Dev.to WebDev23일 전공공지능 분석AI 모델
12
$5/월 DigitalOcean Droplet에서 Ollama + MinIO Object Storage로 Llama 3.2 배포하는 방법: 분산 추론과 지속적인 모델 캐싱
이 글은 고가의 Claude나 GPT API 대신 월 5달러 규모의 저렴한 클라우드 인프라를 활용해 Llama 3.2를 직접 호스팅하는 구체적인 가이드를 제공합니다. MinIO를 활용한 모델 캐싱과 Docker 기반의 배점 방식을 통해 비용 효율적이면서도 확장 가능한 자체 추론 엔진 구축 전략을 다룹니다.
How to Deploy Llama 3.2 with Ollama + MinIO Object Storage on a $5/Month DigitalOcean Droplet: Distributed Inference with Persistent Model Caching↗dev.to
Dev.to WebDev23일 전공공지능 분석AI 모델
13
$5/월 DigitalOcean Droplet에서 Ollama + PostgreSQL 벡터 캐싱으로 Llama 3.2 배포하는 방법: 프로덕션 RAG을 위한 80% 저렴한 의미 검색
OpenAI와 Pinecone 등 외부 API에 의존하는 기존 RAG 방식의 높은 비용 문제를 해결하기 위해, 저렴한 VPS에 LMS와 pgvector를 구축하는 방법을 제시합니다. 벡터 캐싱을 통해 중복된 임베딩 연산을 제거함으로써 검색 비용을 획기적으로 낮추고 운영 효율성을 극대화하는 것이 핵심입니다.
How to Deploy Llama 3.2 with Ollama + PostgreSQL Vector Caching on a $5/Month DigitalOcean Droplet: 80% Cheaper Semantic Search for Production RAG↗dev.to
Dev.to WebDev23일 전공공지능 분석AI 모델
14
$5/월 DigitalOcean Droplet에 Llama 2 배포하는 방법
이 글은 Ollama와 4비트 양적화 기술을 활용하여 월 6달러 규모의 저사양 클라우드 인스턴스에서도 Llama 2 7B 모델을 성공적으로 구동하는 가이드를 제공합니다. API 비용 부담을 줄이려는 개발자들에게 비용 최적화, 데이터 보안, 그리고 독립적인 인프라 구축이라는 구체적인 솔루션을 제안합니다.
How to Deploy Llama 2 on a $5/Month DigitalOcean Droplet↗dev.to
Dev.to WebDev23일 전공공지능 분석AI 모델
15
AI 음악에서 돈 게임은 잃게 될 것이다.
AI 생성 음악의 무분별한 대량 생산은 스팸으로 간주되어 가치가 급락할 것이라고 경고합니다. 대신 명확한 컨셉과 청중을 정의하고, AI를 원재료로 활용하여 인간의 감성과 불완전함을 더하는 하이브리드 워크플로우를 구축해야 수익성을 확보할 수 있습니다.
You will lose the Money Game in AI music.↗indiehackers.com
Indie Hackers23일 전공공지능 분석AI 모델
16
에어 갭 Mac에서 Llama.cpp 구축 및 실행하기
llama.cpp의 최신 WebUI 기능이 빌드 과정에서 외부 자산을 다운로드하려고 시도하여 오프라인 환경의 빌드를 방해하는 문제를 다룹니다. 이를 해결하기 위해 UI 관련 옵션을 모두 비활성화하는 방법과 macOS의 GateKeeper 보안 경고를 우회하는 실질적인 명령어를 안내합니다.
Building and Running Llama.cpp on an Air-Gapped Mac↗dev.to
Dev.to OpenSource23일 전공공지능 분석AI 모델
17
Apple Silicon은 OpenRouter보다 비용이 더 많이 든다
고성능 Apple Silicon 기반의 로컬 AI 추론은 하드웨어 감가상각비로 인해 OpenRouter 대비 토큰당 비용이 훨씬 높으며, 추론 속도 또한 클라우드 서비스가 압도적으로 빠릅니다. 따라서 대규모 작업에는 로컬 환경보다 클라우드 API를 활용하는 것이 비용과 효율 측면에서 훨씬 유리하다는 결론입니다.
Apple Silicon costs more than OpenRouter↗williamangel.net
Hacker News23일 전공공지능 분석AI 모델
18
샤뉴엘 추측과 Triton의 FPSan 의미론
FPSan은 부동 소수점 연산의 비결합성으로 인해 발생하는 연산 최적화의 불확실성을 해결하고자, 부동 소수점을 정수 환(ring)으로 매핑하여 프로그램의 대수적 동등성을 검증하는 Triton 컴파일러 패스입니다. 이 도구는 행렬 곱셈과 셀프 어텐션 등 주요 AI 커널을 지원하며, 수학적 증명을 통해 최적화된 코드의 정확성을 보장합니다.
Schanuel's Conjecture and the Semantics of Triton's FPSan↗cp4space.hatsya.com
Hacker News23일 전공공지능 분석AI 모델
19
지역 LLM이 벤치마크에서는 뛰어난 성과를 내지만 실제 작업에서는 실패하는 이유
MMLU 등 기존 벤치마크는 모델의 단일 턴 추론 능력만 측정할 뿐, 실제 에이전트가 직면하는 도구 호출, 상태 유지, 오류 복구 능력을 반영하지 못합니다. 따라서 개발자는 모델 도입 전 실제 워크플로우를 모사한 자체적인 에이전트 평가 환경(Agentic Eval Harness)을 구축하여 모델의 실질적인 성능을 검증해야 합니다.
Why your local LLM aces benchmarks but fails real terminal tasks↗dev.to
Dev.to DevOps23일 전공공지능 분석AI 모델
20
LLM 활성화 방향 조작, 로컬로: 직접 모델 조작의 보안 함의
DeepSeek-V4-Flash와 같은 고성능 로컬 모델의 등장으로 LLM의 내부 활성화 값을 조작하는 기술이 대중화되고 있습니다. 이는 기존의 프롬프트 수준 안전 장치를 무력화할 수 있는 새로운 공격 표면을 형성하며, 모델 내부 조작이 학술적 연구를 넘어 실질적인 보안 위협으로 부상하고 있음을 시사합니다.
LLM Activation Steering Goes Local: Security Implications of Direct Model Manipulation↗dev.to
Dev.to AI23일 전공공지능 분석AI 모델
21
Claude Mythos, Google Cloud Console에서 GA 출시, 프리뷰 레이블 삭제
구글 클라우드 콘솔에서 Claude Mythos의 프리뷰 표시가 사라지며 정식 서비스(GA)로 전환되었습니다. 이는 구글과 앤스로픽의 파트너십이 단순 투자를 넘어 클라우드 인프라 수준의 깊은 통합 단계로 진입했음을 시사하며, GCP 내 Gemini와 직접 경쟁하는 구도를 형성합니다.
Claude Mythos Goes GA in Google Cloud Console, Drops Preview Label↗dev.to
Dev.to AI23일 전공공지능 분석AI 모델
22
Gemini Omni 출시 소개
구글 딥마인드는 자연어 명령만으로 영상의 캐릭터, 물리 효과, 배경을 일관성 있게 수정할 수 있는 제미나이 옴니(Gemini Omni)를 공개했습니다. 이 모델은 단순한 영상 생성을 넘어 물리적 역학(중력, 유체 역학 등)과 방대한 세계 지식을 바탕으로 정교한 스토리텔링이 가능한 것이 특징입니다.
Introducing Gemini Omni↗deepmind.google
DeepMind Blog23일 전공공지능 분석AI 모델
23
Gemini for Science: AI 실험과 새로운 발견 시대를 위한 도구
구글은 가설 생성(Co-Scientist), 계산적 발견(AlphaEvolve), 문헌 분석(NotebookLM)을 포함한 과학 연구 전용 AI 도구 모음을 발표했습니다. 이 도구들은 방대한 과학 데이터를 처리하고 실험 과정을 자동화하여 연구자가 고차원적인 문제 해결에 집중할 수 있도록 돕는 '연구 가속기' 역할을 목표로 합니다.
Gemini for Science: AI experiments and tools for a new era of discovery↗deepmind.google
DeepMind Blog23일 전공공지능 분석AI 모델