스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 04. 18. 오전 10:12 KST·총 24건

AI 모델 관련 글 — 70 페이지

0
클로드 API 요금 60% 절감, 품질 손실 없이 하는 방법
Claude API 비용을 60% 절감하는 핵심 전략은 작업의 복잡도에 따라 모델(Haiku, Sonnet, Opus)을 다르게 사용하는 '태스크 라우팅(Task Routing)'입니다. 단순 작업은 저렴한 모델로, 고도의 추론이 필요한 작업에만 최상위 모델을 할당하여 품질 저하 없이 운영 비용을 최적화할 수 있습니다.
How I Cut My Claude API Bill 60% Without Losing Quality↗dev.to
Dev.to DevOps1개월 전공공지능 분석AI 모델
1
OpenAI의 전 소라 책임자가 떠난다
OpenAI가 Sora와 같은 실험적 프로젝트를 축소하고 코딩 및 엔터프라이즈 솔루션에 집중하기 위해 핵심 인력의 퇴사와 조직 개편을 단행합니다. 이에 따라 Sora 팀 리더와 AI 과학 부문 부사장이 회사를 떠나며, 관련 연구 프로젝트들도 기업용 도구로 통합될 예정입니다.
OpenAI’s former Sora boss is leaving↗theverge.com
The Verge1개월 전공공지능 분석AI 모델
2
아다, 그 설계, 그리고 언어를 구축한 언어
미 국방부(DoD)의 소프트웨어 파편화 문제를 해결하기 위해 탄생한 Ada 언어는, 현대의 Rust, Go, C# 등이 뒤늦게 채택하고 있는 강력한 안전성과 동시성 기능을 이미 수십 년 전에 구현한 선구적인 언어입니다. 이 글은 기술적 부채를 해결하기 위한 철저한 요구사항 정의가 어떻게 혁신적인 설계로 이어질 수 있는지를 보여줍니다.
Ada, its design, and the language that built the languages↗iqiipi.com
Hacker News1개월 전공공지능 분석AI 모델
3
Claude Opus 4.7 세션당 20–30% 더 많은 비용 발생
Claude 4.7의 새로운 토크나이저가 영어 및 코드 데이터에서 기존 4.6 모델 대비 최대 1.47배 더 많은 토큰을 사용한다는 분석입니다. 이는 Anthropic이 정밀한 지시 이행 능력을 높이기 위해 의도적으로 선택한 트레이드오프이며, 개발자들의 운영 비용과 컨텍스트 윈도우 효율성에 직접적인 변화를 예고합니다.
Claude Opus 4.7 costs 20–30% more per session↗claudecodecamp.com
Hacker News1개월 전공공지능 분석AI 모델
4
Anthropic 'Claude Design' 출시: 디자인과 개발의 경계를 허무는 AI
Anthropic이 텍스트와 코드를 기반으로 디자인, 프로토타입, 슬라이드 등 시각적 결과물을 생성하는 'Claude Design'을 출시했습니다. Claude Opus 4.7 모델을 탑재하여 기존 디자인 시스템을 자동으로 적용하며, 생성된 디자인을 Claude Code로 즉시 전달하여 개발로 이어지는 혁신적인 워크플로우를 제공합니다.
Claude Design↗anthropic.com
Hacker News1개월 전공공지능 분석AI 모델
5
AiVIS.biz CITE LEDGER, AI 답변 엔진이 귀사 웹사이트를 검증하고 해석하며 추출하고 인용할 수 있는지 확인
AiVIS.biz는 ChatGPT, Perplexity, Gemini 등 주요 AI 엔진이 웹사이트의 정보를 얼마나 정확하게 추출, 해석 및 인용하는지 검증하는 AI 엔티티 무결성 시스템입니다. BRAG 방법론을 통해 데이터의 신뢰성을 0-10록 점수로 수치화하고, AI 검색 결과에서의 오류를 수정하기 위한 구체적인 기술적 가이드를 제공합니다.
AiVIS.biz CITE LEDGER verifies whether AI answer engines: can verify, interpret, extract and cite your website↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
6
트랜스포머 이해하기 Part 9: 셀프 어텐션 레이어 스태킹
이 기사는 트랜스포머 모델에서 셀프 어텐션 레이어를 쌓는(Stacking) 이유와 그 기술적 이점을 설명합니다. 단순한 위치 인코딩을 넘어, 셀프 어텐션 값을 통해 문장 내 모든 단어의 문맥 정보를 통합하고, 레이어를 중첩함으로써 복잡한 문장 구조와 관계를 학습하는 원리를 다룹니다.
Understanding Transformers Part 9: Stacking Self-Attention Layers↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
7
Anthropic의 신규 사이버 보안 모델, 정부와의 관계 회복에 도움을 줄 수 있을까
앤스로픽(Anthropic)이 발표한 새로운 사이버 보안 특화 모델 'Claude Mythos Preview'가 미 정부와의 정치적 갈등을 해결할 돌파구가 될 것으로 주목받고 있습니다. 이 모델은 브라우저 및 OS의 취약점을 찾아내는 강력한 기능을 갖추어, 미 정보기관 및 글로벌 대기업들이 이미 도입을 검토하거나 사용 중입니다.
Anthropic’s new cybersecurity model could get it back in the government’s good graces↗theverge.com
The Verge1개월 전공공지능 분석AI 모델
8
행동 양식 테스트에서 172개의 봇을 평가했습니다. OpenAI는 최저점을 기록했습니다.
OpenAI의 GPTBot이 사용자에게 보이지 않는 웹상의 숨겨진 콘텐츠를 무차별적으로 수집하는 기술적 결함이 발견되었습니다. 이는 ClaudeBot이나 TwitterBot과 달리 CSS를 렌더링하지 못해 발생하는 문제로, 웹사이트 운영자들에게 보안 및 데이터 관리 측면에서 큰 위협이 될 수 있습니다.
We scored 172 bots on behavioral conduct. OpenAI came in last.↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
9
비옥이 AI 모델 개발을 위한 새로운 API 출시
Byoky는 API 키를 공유하지 않고도 다양한 AI 모델의 예산(토큰)을 관리하고 공유할 수 있는 새로운 AI 토큰 네트워크 플랫폼을 출시했습니다. GPT, Claude, Gemini 등 13개 이상의 제공업체를 지원하며, 모델 간 토큰 변환 및 예산 선물 기능을 제공합니다.
Byoky↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
10
Open WebUI vs. ChatGPT: 2026년, 당신에게 맞는 선택은?
이 기사는 클라우드 기반의 ChatGPT와 자가 호스팅 방식인 Open WebUI를 다각도로 비교하며, 사용자의 기술적 역량, 보안 요구사항, 예산에 따른 최적의 선택지를 제시합니다. 특히 단순한 모델 사용을 넘어, 다양한 모델을 통합 관리하고 데이터 프라이버시를 확보할 수 있는 'AI 콕핏(Cockpit)'으로서의 Open WebUI의 가치를 조명합니다.
Open WebUI vs. ChatGPT: Which One Is Right for You in 2026?↗dev.to
Dev.to DevOps1개월 전공공지능 분석AI 모델
11
Anthropic, 빠른 시각 자료 제작을 위한 신제품 Claude Design 출시
Anthropic이 비디자이너도 텍스트 프롬프트만으로 프로토타입, 슬라이드, 원페이저 등 시각 자료를 빠르게 제작할 수 있는 실험적 제품 'Claude Design'을 출시했습니다. 이 도구는 기업의 디자인 시스템을 학습하여 일관된 브랜딩을 유지할 수 있으며, Canva와 같은 기존 디자인 툴과 연동되는 것을 목표로 합니다.
Anthropic launches Claude Design, a new product for creating quick visuals↗techcrunch.com
TechCrunch1개월 전공공지능 분석AI 모델
12
언웨이트: 품질 저하 없이 LLM을 22% 압축한 방법
Cloudflare가 모델의 정확도 손실 없이 LLM 가중치를 15~22% 압축할 수 있는 'Unweight' 기술을 공개했습니다. 이 기술은 GPU의 메모리 대역폭 병목 현상을 해결하기 위해 온칩(on-chip) 메모리에서 가중치를 직접 압축 해제함으로써, 더 적은 VRAM으로 더 많은 모델을 더 빠르게 실행할 수 있게 합니다.
Unweight: how we compressed an LLM 22% without sacrificing quality↗blog.cloudflare.com
Cloudflare Blog1개월 전공공지능 분석AI 모델
13
토큰 최대화, 과연 어디로 향하는 길인가?
AI 업계 내부자와 외부자 사이의 격차가 심화되는 가운데, OpenAI와 Anthropic 등 주요 플레이어들이 모델 개발을 넘어 생태계 확장과 엔터프라이즈 시장 선점을 위해 치열하게 경쟁하고 있습니다. 특히 AI 인프라의 재편과 산업 전반의 AI 통합 움직임이 가속화되고 있습니다.
Are we tokenmaxxing our way to nowhere?↗techcrunch.com
TechCrunch1개월 전공공지능 분석AI 모델
14
AI 학습을 위한 리디렉션, 정규 콘텐츠 강제 적용
클라우드플레어(Cloudflare)가 AI 학습용 크롤러가 구버전 대신 최신 콘텐츠를 학습하도록 유도하는 'Redirects for AI Training' 기능을 출시했습니다. 이 기능은 기존의 canonical 태그를 활용해 인증된 AI 크롤러에게 HTTP 301 리디렉션을 자동으로 적용함으로써, AI 모델이 오래된 정보를 학습하는 문제를 방지합니다.
Redirects for AI Training enforces canonical content↗blog.cloudflare.com
Cloudflare Blog1개월 전공공지능 분석AI 모델
15
정확성이 인지보다 중요할 때: 벤치마킹에서 아키텍처가 중요한 이유
VMware가 발표한 Red Hat OpenShift 대비 5.6배 Pod 밀도 우위 주장이 아키텍처 설계의 비대칭성을 이용한 왜곡된 벤치마크임을 비판합니다. 결과 수치보다 테스트 방법론과 노드 구성의 공정성이 기술적 평가의 핵심임을 강조합니다.
Precision over perception: Why architecture matters in benchmarking↗redhat.com
Hacker News1개월 전공공지능 분석AI 모델
16
Oracle AI Database에서 Python으로 ONNX 임베딩 워크플로우 구축하기
Oracle AI Database 26ai를 활용하여 ONNX 임베딩 모델을 데이터베이스 내부로 직접 로드하고, SQL만으로 임베딩 생성부터 벡터 검색까지 수행하는 통합 워크플로우를 소개합니다. 이 방식은 외부 임베딩 서비스나 별도의 벡터 DB 없이 데이터베이스 내에서 모든 과정을 완결함으로써 데이터 이동과 인프라 복잡성을 획기적으로 줄여줍니다.
Building ONNX Embedding Workflows in Oracle AI Database with Python↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
17
AI와 게임화로 만드는 친환경 습관, Green Habit Tracker 분석
Google Gemini를 활용해 개인의 작은 친환경 습관을 기록하고 보상하는 'Green Habit Tracker' 앱이 소개되었습니다. 사용자의 실천 내역을 바탕으로 AI가 맞춤형 에코 팁을 제공하며, 게임화(Gamification) 요소를 통해 지속 가능한 라이프스타일을 유도하는 것이 핵심입니다.
🌱 Green Habit Tracker↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
18
[2026] LLM 관측 가능성을 위한 OpenTelemetry — 자체 호스팅 설정
이 기사는 LLM 에이전트 워크플로우의 비용 효율적인 모니터링을 위해 OpenTelemetry(OTel)를 활용한 자체 호스팅 관측 가능성(Observability) 구축 방법을 설명합니다. 관리형 플랫폼의 높은 비용을 피하면서도 데이터 소유권을 유지하고, 표준화된 규약을 통해 모델 교체와 비용 추적을 용이하게 하는 아키텍처를 제안합니다.
[2026] OpenTelemetry for LLM Observability — Self-Hosted Setup↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
19
응답 후 LLM 분류 실행: Next.js after() + OpenRouter, 콜당 0.0002달러
Next.js의 `after()` API와 OpenRouter를 활용하여 사용자 응답 지연 없이 호출당 $0.0002라는 초저비용으로 LLM 기반 스팸 분류 시스템을 구축하는 실전 아키텍처를 소개합니다. LLM 호출을 메인 프로세스에서 분리하여 성능, 비용, 안정성을 동시에 확보하는 구체적인 구현 방법을 다룹니다.
Running LLM Classification After the Response: Next.js after() + OpenRouter at $0.0002 per Call↗dev.to
Dev.to WebDev1개월 전공공지능 분석AI 모델
20
이치바 AI
Ichiba AI는 AI 에이전트들이 서로의 제품 추천에 미치는 영향력을 측정하고 분석하는 플랫폼입니다. AI 에이전트 간의 상호작용을 통해 나타나는 마케팅 전술과 'Dark GEO'와 같은 새로운 위협 요소를 데이터로 가시화합니다.
Ichiba AI↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
21
Claude Opus 4.7에 대해 알아야 할 모든 것
Anthropic이 에이전트 작업 성능을 대폭 강화한 Claude Opus 4.7을 출시했습니다. 코딩 능력, 비전 해상도, 명령어 이행의 정확도가 향상되었으며, 새로운 API 에포트(effort) 티어와 작업 예산 설정 기능이 추가되었습니다.
Everything You Need to Know About Claude Opus 4.7↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
22
ERNIE-Image: 포스터, 만화, 텍스트 풍부한 시각 콘텐츠에 최적화된 텍스트-이미지 모델
바이두가 공개한 ERNIE-Image는 단순한 실사 이미지 생성을 넘어, 텍스트 렌더링, 레이아웃 구조, 다중 패널 구성 등 '사용 가능한 시각 콘텐츠' 생성에 최적화된 모델입니다. Diffusion Transformer(DiT) 아키텍처를 기반으로 포스터, 만화, 인포그래픽 등 구조적 정보가 중요한 디자인 영역에서 압도적인 성능을 보여줍니다.
ERNIE-Image: A Text-to-Image Model Built for Posters, Comics, and Text-Rich Visual Content↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
23
ERNIE-Image 분석: Nano Banana 2.0 및 Seedream 4.5와 대적하는 오픈소스 텍스트-이미지 모델
바이두가 공개한 ERNIE-Image는 단순한 이미지 생성을 넘어, 텍스트 가독성과 레이아웃 안정성을 극대화한 '비주얼 콘텐츠 생성 모델'입니다. 포스터, 인포그래픽, 만화 등 구조적 정보 전달이 필요한 실무 영역에 최적화된 성능을 보여줍니다.
ERNIE-Image 解析：对标 Nano Banana 2.0 与 Seedream 4.5 的开源文生图模型↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델