스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 03. 26. 오후 08:30 KST·총 24건

AI 모델 관련 글 — 88 페이지

0
Mistral, 음성 생성을 위한 새로운 오픈소스 모델 공개
프랑스 AI 기업 미스트랄이 음성 AI 비서 및 기업용으로 활용 가능한 새로운 오픈소스 텍스트-음성 변환(TTS) 모델 'Voxtral TTS'를 출시했습니다. 이 모델은 소형 기기에 탑재 가능하고 비용 효율적이며, 9개 언어를 지원하고 미묘한 음성 특성까지 재현하며 실시간 성능을 자랑하여 ElevenLabs, OpenAI 등과 직접 경쟁하게 됩니다.
Mistral releases a new open source model for speech generation↗techcrunch.com
TechCrunch2개월 전공공지능 분석AI 모델
1
AI가 정답을 아는데도 환각을 보이는 이유
이 기사는 AI가 때때로 '환각'을 일으켜 잘못된 정보를 그럴듯하게 제시하는 이유를 심층적으로 설명합니다. AI는 사실을 저장하는 데이터베이스가 아니라, 방대한 텍스트 데이터에서 통계적 패턴을 학습하여 다음 단어를 예측하는 '예측 기계'이기 때문입니다. 따라서 AI는 사실적으로 정확한 텍스트보다는 통계적으로 그럴듯한 텍스트를 생성하도록 훈련되며, 정보가 부족할 때 그럴듯한 패턴을 채워넣으면서 거짓 정보를 만들어낼 수 있습니다.
Why AI Hallucinates Even When It Knows the Answer↗dev.to
Dev.to2개월 전공공지능 분석AI 모델
2
30분 만에 AWS Bedrock과 Python으로 실제 AI 챗봇을 만들었다
이 기사는 AWS Bedrock과 Python을 사용하여 30분 만에 AI 챗봇을 만드는 방법을 설명합니다. OpenAI API 키나 복잡한 설정 없이, 기존 AWS 계정만으로 Claude와 같은 강력한 모델에 접근하여 대화 기록을 기억하는 터미널 기반 챗봇을 구축하는 과정을 보여줍니다.
I Built a Real AI Chatbot With AWS Bedrock and Python in 30 Minutes↗dev.to
Dev.to2개월 전공공지능 분석AI 모델
3
Ensu: Ente의 로컬 LLM 앱
Ente는 빅테크 기업에 의존하지 않는 개인 정보 보호와 통제를 강조하며 오프라인에서 구동되는 로컬 LLM 앱 'Ensu'를 출시했습니다. 이 앱은 완전히 기기 내에서 작동하여 프라이버시를 보장하며, 향후 E2EE 동기화 및 백업 기능을 통해 더욱 개인화된 AI 경험을 제공할 예정입니다. Ensu는 아직 초기 단계이지만, Ente는 과거 로컬 얼굴 인식 기술 성공 사례를 바탕으로 로컬 LLM의 '충분한 역량' 임계점 도달 가능성을 믿고 있습니다.
Ensu – Ente’s Local LLM app↗ente.com
Hacker News2개월 전공공지능 분석AI 모델
4
ARC-AGI-3은 AI 에이전트의 인간과 유사한 지능을 측정하기 위해 고안된 새로운 인터랙티브 추론 벤치마크입니다. 이는 정적인 퍼즐 해결을 넘어, 에이전트가 새로운 환경에서 지속적으로 학습하고, 경험을 통해 적응하며, 목표를 효율적으로 달성하는 능력을 평가합니다. 궁극적으로 인간 학습과 AI 학습 간의 격차를 수량화하여 범용 인공지능(AGI) 개발을 촉진하는 데 중점을 둡니다.
ARC-AGI-3은 AI 에이전트의 인간과 유사한 지능을 측정하기 위해 고안된 새로운 인터랙티브 추론 벤치마크입니다. 이는 정적인 퍼즐 해결을 넘어, 에이전트가 새로운 환경에서 지속적으로 학습하고, 경험을 통해 적응하며, 목표를 효율적으로 달성하는 능력을 평가합니다. 궁극적으로 인간 학습과 AI 학습 간의 격차를 수량화하여 범용 인공지능(AGI) 개발을 촉진하는 데 중점을 둡니다.
ARC-AGI-3↗arcprize.org
Hacker News2개월 전공공지능 분석AI 모델
5
Claude Skills, Plugins, Agent Teams, Cowork 완벽 분석
클로드(Claude)의 AI 기능은 '스킬(Skills)'의 단순한 재사용 가능한 기능부터 외부 데이터에 접근하는 '플러그인(Plugins)', 여러 AI가 협업하는 '에이전트 팀(Agent Teams)', 그리고 복잡한 비즈니스 워크플로우를 자동화하는 '코워크(Cowork)'까지 점진적으로 발전합니다. 이 글은 각 기능의 특징과 적용 시점을 실제 예시를 통해 설명하며, AI 활용의 복잡도 증가에 따른 유기적 연동 방안을 제시합니다.
Claude Skills, Plugins, Agent Teams, and Cowork demystified.↗dev.to
Dev.to2개월 전공공지능 분석AI 모델
6
Google, 새로운 AI 메모리 압축 알고리즘 TurboQuant 공개… 인터넷은 'Pied Piper'라 부른다
구글이 AI 추론(inference) 시 작업 메모리(KV 캐시)를 최대 6배까지 줄이는 새로운 AI 메모리 압축 알고리즘 'TurboQuant'를 공개했습니다. 이 기술은 성능 저하 없이 AI 실행 비용을 대폭 절감하고 효율을 극대화하여, HBO 드라마 '실리콘 밸리'의 압축 기술 'Pied Piper'에 비유되며 큰 기대를 모으고 있습니다. 현재는 연구실 단계의 기술이지만, AI 운영 비용 절감에 큰 영향을 미칠 잠재력을 가집니다.
Google unveils TurboQuant, a new AI memory compression algorithm — and yes, the internet is calling it ‘Pied Piper’↗techcrunch.com
TechCrunch2개월 전공공지능 분석AI 모델
7
Google, Lyria 3 Pro 음악 생성 모델 출시
구글이 음악 생성 모델 '리리아 3 프로(Lyria 3 Pro)'를 출시하며, 기존 30초에서 최대 3분 길이의 트랙 생성을 지원합니다. 이 모델은 사용자에게 향상된 창작 제어 기능과 더불어 인트로, 벌스, 코러스 등 세부 트랙 구조를 이해하여 정교한 음악 생성을 가능하게 합니다. 리리아 3 프로는 제미니(Gemini) 앱 유료 구독자 및 구글 비즈(Google Vids), 프로듀서AI(ProducerAI), 그리고 버텍스AI(Vertex AI) 등 구글의 다양한 앱과 엔터프라이즈 도구에 통합될 예정입니다.
Google launches Lyria 3 Pro music generation model↗techcrunch.com
TechCrunch2개월 전공공지능 분석AI 모델
8
Lyria 3으로 창작하세요, 저희의 최신 음악 생성 모델
구글 딥마인드가 개발자를 위한 차세대 음악 생성 모델인 'Lyria 3'를 공개했습니다. Gemini API와 Google AI Studio를 통해 제공되는 이 모델은 긴 곡을 만드는 Pro 버전과 짧은 클립을 만드는 Clip 버전으로 나뉘며, 텍스트와 이미지를 활용한 정교한 음악 제어가 가능합니다.
Build with Lyria 3, our newest music generation model↗blog.google
Google AI Blog2개월 전공공지능 분석AI 모델
9
Model Spec에 대한 우리의 접근 방식
OpenAI가 AI 모델의 행동 지침을 정의하는 'Model Spec'을 공개했습니다. 이 프레임워크는 AI의 안전성(Safety), 사용자 자유(User Freedom), 그리고 책임성(Accountability) 사이의 균형을 맞추기 위한 공개된 표준을 지향합니다.
Inside our approach to the Model Spec↗openai.com
OpenAI Blog2개월 전공공지능 분석AI 모델
10
ChatGPT 쇼핑
ChatGPT가 'Agentic Commerce Protocol'을 통해 글로벌 리테일러와 연결된 새로운 쇼핑 기능을 출시했습니다. 시각적 비교, 이미지 검색, 개인화된 구매 가이드를 제공하며, 모든 사용자에게 무료로 개방되어 쇼핑 경험의 혁신을 예고합니다.
ChatGPT Shopping↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
11
ChatGPT 내 제품 탐색 기능 강화
ChatGPT는 Agentic Commerce Protocol을 기반으로 더욱 풍부하고 시각적으로 몰입감 있는 쇼핑 경험을 선보이며, 제품 탐색, 제품 간 비교, 그리고 merchant integration을 지원합니다.
Powering product discovery in ChatGPT↗openai.com
OpenAI Blog2개월 전공공지능 분석AI 모델
12
생산 최적화 — Inference 비용 및 성능 제어
이 글은 LLM 기반 고객 서비스 시스템에서 추론 비용과 성능 문제를 해결하기 위한 3단계 최적화 아키텍처를 제시합니다. 이 아키텍처는 이중 레이어 시맨틱 캐싱, 계층형 모델 라우팅, 그리고 시나리오 인식 프롬프트 압축을 통해 비용을 획기적으로 절감하고 성능을 향상시키면서도 답변 품질을 유지하는 방법을 설명합니다. 특히 70% 이상의 반복 쿼리를 캐싱으로 처리하여 불필요한 LLM 호출을 제거하는 데 중점을 둡니다.
Production Optimization: Inference Cost and Performance Control↗dev.to
Dev.to2개월 전공공지능 분석AI 모델
13
LLMs, 내가 마실 커피를 예측하다
이 기사는 LLM이 복잡한 물리적 실험 결과를 얼마나 정확하게 예측할 수 있는지 테스트합니다. 커피가 식는 과정을 예측하는 문제에서, LLM들은 나름의 방정식을 제시했지만 실제 실험 결과와는 초기 냉각 속도 등에서 큰 차이를 보이며 현실 세계 예측의 한계를 드러냈습니다. 이는 LLM이 언어적 추론에는 뛰어나지만 다중 물리 현상에 대한 깊은 이해는 부족함을 시사합니다.
LLMs predict my coffee↗dynomight.net
Hacker News2개월 전공공지능 분석AI 모델
14
Flash-MoE: 397B 파라미터 모델을 노트북에서 구동
Flash-MoE 기술은 397B 파라미터 규모의 MoE 모델을 48GB RAM MacBook Pro에서 초당 4.4개 이상의 토큰 속도로 구동하는 데 성공했습니다. 이는 SSD 스트리밍과 Metal GPU 최적화를 통해 달성되었으며, 방대한 모델을 로컬 디바이스에서 실행할 수 있는 가능성을 열었습니다.
Flash-MoE: Running a 397B Parameter Model on a Laptop↗github.com
Hacker News2개월 전공공지능 분석AI 모델
15
Transformer 회로에 대한 직관
이 글은 트랜스포머 모델의 작동 원리를 수학적으로 깊이 이해하려는 '메커니즘 해석 가능성(Mechanistic Interpretability, MI)'에 대한 저자의 직관을 공유합니다. 특히 MI가 AI 정렬(AI Alignment)과 모델의 오작동 방지에 필수적임을 강조하며, 트랜스포머의 핵심 구성 요소인 잔여 스트림(Residual Stream)의 개념적, 수학적 역할을 설명합니다.
Intuitions for Tranformer Circuits↗connorjdavis.com
Hacker News2개월 전공공지능 분석AI 모델
16
Sora로 안전하게 창작하기
OpenAI가 Sora 2 출시와 함께 발표한 강력한 안전 가이드라인을 다룹니다. C2PA 메타데이터를 통한 콘텐츠 출처 증명, 사용자 동의 기반의 'Characters' 기능을 통한 초상권 보호, 그리고 청소년 및 저작권 보호를 위한 다각적인 방어 체계를 핵심으로 합니다.
Creating with Sora Safely↗openai.com
OpenAI Blog2개월 전공공지능 분석AI 모델
17
[릴리즈 노트] AI가 직접 컴퓨터 조작, 오픈AI GPT-5.4 출시
오픈AI가 코딩 및 추론 능력을 통합한 프론티어 모델 GPT-5.4를 공개하며 AI가 직접 데스크톱 환경을 조작하는 네이티브 컴퓨터 사용 기능을 최초로 선보였습니다. 100만 토큰 컨텍스트 윈도우와 효율적인 Tool Search 기능으로 개발자 에이전트 구축에 최적화된 성능을 제공, AI의 자율성과 활용 범위를 혁신적으로 확장합니다. 이는 금융 및 전문 사무 업무 성능 향상과 함께 API 효율을 극대화할 것으로 기대됩니다.
요즘IT↗yozm.wishket.com
요즘IT2개월 전공공지능 분석AI 모델
18
[릴리즈 노트] 역대 최강 소형 모델, 오픈AI GPT-5.4 mini·nano 출시
오픈AI가 GPT-5.4의 성능을 경량화한 소형 모델 GPT-5.4 mini와 nano를 동시 출시했습니다. mini는 기존 모델 대비 2배 이상 빠르면서도 풀 모델에 근접한 성능을 제공하며 ChatGPT, API, Codex에서 사용 가능합니다. nano는 오픈AI 라인업 중 가장 저렴하며 분류, 데이터 추출 등 특정 작업에 최적화되어 API 전용으로 제공됩니다. 이는 비용 효율성과 특정 목적에 맞는 AI 활용을 가속화할 전망입니다.
요즘IT↗yozm.wishket.com
요즘IT2개월 전공공지능 분석AI 모델
19
Mamba-3는 추론 효율성을 최우선 목표로 설계된 새로운 상태 공간 모델(SSM)입니다. 기존 Mamba-2가 학습 속도에 집중한 것과 달리, Mamba-3는 더 풍부한 재귀 공식, 복소수 값 상태 추적, 그리고 정확도를 높이는 MIMO 변형을 통해 추론 성능을 대폭 개선했습니다. 그 결과, Llama-3.2-1B (1.5B 규모)를 포함한 기존 모델들을 모든 시퀀스 길이에서 사전 채우기 및 디코딩 지연 시간 면에서 능가합니다.
Mamba-3는 추론 효율성을 최우선 목표로 설계된 새로운 상태 공간 모델(SSM)입니다. 기존 Mamba-2가 학습 속도에 집중한 것과 달리, Mamba-3는 더 풍부한 재귀 공식, 복소수 값 상태 추적, 그리고 정확도를 높이는 MIMO 변형을 통해 추론 성능을 대폭 개선했습니다. 그 결과, Llama-3.2-1B (1.5B 규모)를 포함한 기존 모델들을 모든 시퀀스 길이에서 사전 채우기 및 디코딩 지연 시간 면에서 능가합니다.
Mamba-3↗together.ai
Hacker News2개월 전공공지능 분석AI 모델
20
프로덕션 등급 GraphRAG Data Pipeline: PDF Parsing부터 Knowledge Graph까지 엔드 투 엔드 구축
이 기사는 지능형 고객 서비스에서 정형 및 비정형 하이브리드 데이터 처리의 한계를 극복하기 위한 프로덕션 등급 데이터 파이프라인 구축을 다룹니다. Neo4j를 통한 구조화된 지식 그래프, MinerU + LitServe를 통한 멀티모달 PDF 파싱, Microsoft GraphRAG를 통한 비정형 데이터 색인 기술을 통합하여 통일된 검색 및 조정을 목표로 합니다. 이는 기존 RAG 솔루션의 한계를 넘어 엔터프라이즈급 LLM 시스템의 핵심 난제를 해결하는 중요한 진전입니다.
# Production-Grade GraphRAG Data Pipeline: End-to-End Construction from PDF Parsing to Knowledge Graph↗dev.to
Dev.to2개월 전공공지능 분석AI 모델
21
Meta의 전언어 MT, 1,600개 언어 지원
메타가 1,600개 언어를 지원하는 차세대 기계 번역 시스템 '옴니링구얼 MT(OMT)'를 발표했습니다. 이 시스템은 기존 모델의 '생성 병목' 현상을 극복하여 소외 언어에 대한 번역 품질을 크게 향상시키며, 1B~8B 파라미터의 소형 모델이 70B LLM의 성능을 능가하는 효율성을 보여줍니다. 이는 종합적인 데이터 전략과 LLM 특화 기술 덕분입니다.
Meta's Omnilingual MT for 1,600 Languages↗ai.meta.com
Hacker News2개월 전공공지능 분석AI 모델
22
Rotifer v0.6.5: 크로스 바인딩 증명: 블록체인에 배포하지 않고 IR 이식성을 검증한 방법
로티퍼 v0.6.5는 실제 블록체인 배포 대신 모의 환경을 활용하여 AI 모델의 핵심 가치인 '크로스-플랫폼 이식성'을 성공적으로 검증하고, 향후 개발을 위한 기술적 토대를 마련했습니다.
Rotifer v0.6.5: Cross-Binding Proof — How We Validated IR Portability Without Deploying to a Blockchain↗dev.to
Dev.to2개월 전공공지능 분석AI 모델
23
더 저렴한 LLM 제공업체로 전환 시 발생하는 'Retry Tax' 현상 (이거 나만 모르는 건가?)
많은 스타트업이 저렴한 LLM으로 전환 시 직면하는 'Retry Tax'는 토큰당 비용만 보고 선택할 경우 실제 절감 효과가 줄어드는 현상입니다. 저렴한 모델은 실패율이 높아 재시도가 많아지면서 총 API 호출 비용이 예상보다 증가하며, 이는 겉으로 보이는 비용 절감률보다 훨씬 낮은 실제 절감률을 초래합니다. 필자는 중요도에 따라 GPT와 딥시크를 혼합 사용하는 하이브리드 접근법을 통해 효율을 극대화할 것을 제안합니다.
The "Retry Tax" thing when switching to cheaper LLM providers (am I crazy or does nobody talk about this?) - I will not promote↗reddit.com
Reddit r/startups2개월 전공공지능 분석AI 모델