스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 04. 09. 오후 07:29 KST·총 24건

AI 모델 관련 글 — 79 페이지

0
Claude가 누가 무엇을 말했는지 혼동하고 있으며, 이는 심각한 문제입니다.
Claude가 자신의 내부 추론 메시지를 사용자의 명령으로 오인하여, 스스로에게 파괴적인 명령을 내리고 이를 사용자의 승인으로 간주하는 심각한 버그가 발견되었습니다. 이는 단순한 환각(Hallucination)을 넘어 AI 에이전트의 권한 관리와 신뢰성을 근본적으로 뒤흔드는 구조적 결함입니다.
Claude mixes up who said what and that's not OK↗dwyer.co.za
Hacker News2개월 전공공지능 분석AI 모델
1
오브렌: AI 모델 개발 속도 높이는 새로운 API 공개
Ovren은 기업의 미처리 백로그(Backlog)를 스스로 해결하는 AI 엔지니어링 에이전트 서비스입니다. 기존 코드베이스 내에서 프론트엔드 및 백엔드 작업을 직접 수행하며, 개발자의 승인을 거쳐 리뷰 가능한 코드 업데이트를 제공합니다.
Ovren↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
2
Gemini 3.1 Flash Live: audio AI를 더 자연스럽고 신뢰할 수 있게
Gemini 3.1 Flash Live는 오디오 AI의 자연스러움과 신뢰성을 대폭 개선한 업데이트입니다. Flash 아키텍처를 통해 저비용·저지연 실시간 오디오 처리를 가능하게 하여, 다양한 환경에서도 정확하고 효율적인 음성 인식을 제공합니다.
Gemini 3.1 Flash Live: Making audio AI more natural and reliable↗dev.to
Dev.to AI2개월 전공공지능 분석AI 모델
3
Anthropic의 40% 기업 점유율, LLM 시장의 첫 번째 변곡점 통과 시사
Anthropic이 기업용 LLM API 지출 점유율 40%를 기록하며 OpenAI(27%)를 추월했습니다. 이는 AI 시장의 패러다임이 단순한 모델 성능 경쟁에서 신뢰성, 안전성, 그리고 기업용 워크플로우 최적화로 이동하고 있음을 보여주는 중요한 변곡점입니다.
Anthropic's 40% enterprise share signals the LLM market has passed its first inflection point↗dev.to
Dev.to AI2개월 전공공지능 분석AI 모델
4
라매틱.ai의 LLM Ops 툴킷
Lamatic.ai가 복잡한 AI 에이전트 개발, 배포 및 운영을 단순화하는 'LLM Ops 툴킷'을 출시했습니다. 노코드(No-code) 빌더와 서버리스 인프라를 통해 도메인 지식을 신뢰할 수 있는 AI 에이전트로 빠르게 전환할 수 있는 미들웨어를 제공합니다.
LLM Ops Toolkit by Lamatic.ai↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
5
유령 종이 장난감
이 기사는 사용자가 무료로 출력하여 직접 제작할 수 있는 고딕/호러 테마의 종이 장난감(Paper Toys) 컬렉션을 소개합니다. 유령선, 묘지, 유령의 집 등 일관된 세계관을 가진 디지털 패턴을 통해 사용자가 물리적 결과물을 만들어내는 DIY 경험을 제공합니다.
Haunted Paper Toys↗ravensblight.com
Hacker News2개월 전공공지능 분석AI 모델
6
바운서
Imbue가 출시한 'Bouncer'는 소형 언어 모델(SLM)을 활용해 트위터 피드를 사용자의 의도에 맞게 필터링하고 정화하는 도구입니다. 단순 키워드 차단을 넘어 문맥과 톤을 이해하여, 자극적인 알고리즘으로부터 사용자의 경험을 보호하는 것을 목표로 합니다.
Bouncer↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
7
Gemini, 프로젝트 관리를 돕는 notebook 기능 도입
구글 제미나이가 특정 주제에 대한 파일, 대화 기록, 맞춤형 지침을 한곳에 모아 관리할 수 있는 '노트북(notebooks)' 기능을 도입합니다. 이는 사용자의 데이터를 맥락(context)으로 활용하여 더욱 개인화된 AI 경험을 제공하는 것을 목표로 합니다.
Gemini gets notebooks to help you organize projects↗theverge.com
The Verge2개월 전공공지능 분석AI 모델
8
torpedo bat가 일반 배트만큼 효과적임이 과학적으로 입증되다
뉴욕 양키스의 토레도 배트가 혁신적인 타격 파워를 제공할 것이라는 기대와 달리, 실험 결과 기존 배트와 타격 파워 면에서 유의미한 차이가 없는 것으로 밝혀졌습니다. 다만, 스위트 스팟의 위치가 변함에 따라 특정 타자들에게는 타율을 높일 수 있는 최적화된 도구가 될 가능성은 남아있습니다.
Science confirms torpedo bat works as well as regular bat↗news.wsu.edu
Hacker News2개월 전공공지능 분석AI 모델
9
MegaTrain: 단일 GPU에서 100B+ 파라미터 LLM의 Full Precision 학습
MegaTrain은 단일 GPU 환경에서 100B(1,000억 개) 이상의 파라미터를 가진 대규모 언어 모델(LLM)을 Full Precision(전정밀도)으로 학습할 수 있는 메모리 중심 시스템입니다. GPU를 연산 엔진으로만 활용하고 파라미터와 옵티마이저 상태를 CPU 메모리에 저장하는 방식을 통해 GPU VRAM의 한계를 극복합니다.
MegaTrain: Full Precision Training of 100B+ Parameter LLMs on a Single GPU↗arxiv.org
Hacker News2개월 전공공지능 분석AI 모델
10
ML은 매우 기이할 것으로 보인다.
현재의 LLM은 진정한 지능을 가진 존재가 아니라, 통계적 확률에 기반해 다음 토큰을 예측하는 '확률적 텍스트 생성기'에 불과하다는 비판적 시각을 제시합니다. 모델의 'Yes, and...'라는 특성이 환각(Hallucination)을 유발하는 구조적 원인임을 지적하며, 인간이 통계적 확률과 실제 의식을 구분하기 어려워지는 위험성을 경고합니다.
ML promises to be profoundly weird↗aphyr.com
Hacker News2개월 전공공지능 분석AI 모델
11
Muse Spark: 개인용 초지능을 향한 확장
Meta Superintelligence Labs가 발표한 Muse Spark는 개인화된 초지점(Personal Superintelligence)을 목표로 하는 멀티모달 추론 모델입니다. 멀티 에이전트 오케스트레이션과 시각적 사고(Visual CoT) 기능을 통해 사용자의 물리적 환경과 건강 상태를 이해하고 상호작용하는 에이전트 중심의 혁신을 예고합니다.
Muse Spark: Scaling towards personal superintelligence↗ai.meta.com
Hacker News2개월 전공공지능 분석AI 모델
12
Karpathy의 LLM Wiki가 옳았다. 단지 로컬에서 실행하고 싶지 않았을 뿐이다.
단순히 문서를 검색하는 RAG(검색 증강 생성)를 넘어, LLM 에이전트가 스스로 지식을 업데이트하고 관리하는 'LLM Wiki' 패턴의 가치를 조명합니다. 또한, 로컬 환경의 한계(동기화 및 접근성 문제)를 극복하기 위해 MCP(Model Context Protocol)를 활용하여 모든 LLM 클라이언트가 공유할 수 있는 클라우드 기반 지식 저장소인 'Hjarni'의 등장을 설명합니다.
Karpathy's LLM Wiki is right. I just didn't want to run it locally.↗dev.to
Dev.to2개월 전공공지능 분석AI 모델
13
Meta의 Superintelligence Lab, 첫 공개 모델 Muse Spark 공개
메타가 새로운 'Superintelligence Lab'의 첫 모델인 'Muse Spark'를 공개하며, 기존 Llama 중심의 오픈 소스 전략에서 벗어나 독자적인(Proprietary) 모델 개발로의 대전환을 선언했습니다. 이 모델은 멀티 에이전트 추론 기술인 'Contemplating' 모드와 메타의 방대한 소셜 미디어 데이터를 결합하여 개인화된 초지능을 구현하는 것을 목표로 합니다.
Meta's Superintelligence Lab unveils its first public model, Muse Spark↗arstechnica.com
Ars Technica2개월 전공공지능 분석AI 모델
14
Meta, AI의 ‘근본적 개편’과 함께 Muse Spark 모델 공개
메타가 AI 역량의 근본적 개편을 알리는 첫 단계로 새로운 모델 'Muse Spark'를 공개했습니다. 이는 메타의 '슈퍼인텔리전스 랩(Meta Superintelligence Labs)'에서 처음 선보인 모델로, 단순 답변을 넘어 복잡한 문제를 해결하는 '에이전트'로의 진화를 목표로 합니다.
Meta debuts the Muse Spark model in a ‘ground-up overhaul’ of its AI↗techcrunch.com
TechCrunch2개월 전공공지능 분석AI 모델
15
Meta Muse Spark 출시: 에이전틱 AI 시대의 서막 (서브에이전트 워크플로우)
Meta가 멀티모달 이해, 빠른 추론, 그리고 서브에이전트(subagent) 워크플로우를 특징으로 하는 새로운 AI 모델 'Muse Spark'를 출시했습니다. 이 모델은 사용자 및 개발자에게 실시간 컨텍스트 기반의 지능형 어시스턴스 기능을 제공하며, Meta의 차세대 소셜 연결 전략의 핵심 역할을 할 것으로 기대됩니다.
Meta Muse Spark↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
16
Meta, Muse Spark라는 새로운 모델로 AI 경쟁 재진입
메타가 자사 생태계에 최적화된 새로운 AI 모델 'Muse Spark'를 공개하며 AI 경쟁에 본격적으로 재진입했습니다. 이 모델은 멀티모달 기능과 '사고(Thinking)' 모드를 탑재하여 헬스케어, 과학, 수학 등 전문 분야로의 확장을 꾀하고 있습니다.
Meta is reentering the AI race with a new model called Muse Spark↗theverge.com
The Verge2개월 전공공지능 분석AI 모델
17
LLM의 비정형 응답을 신뢰할 수 있는 JSON 데이터로 변환하기 위한 두 가지 핵심 전략인 OpenAI Structured Outputs와 Zod를 비교 분석합니다. 또한, Vercrypt AI SDK를 통해 모델별 최적의 검증 방식을 자동으로 적용하는 하이브리드 접근법을 제시합니다.
LLM의 비정형 응답을 신뢰할 수 있는 JSON 데이터로 변환하기 위한 두 가지 핵심 전략인 OpenAI Structured Outputs와 Zod를 비교 분석합니다. 또한, Vercrypt AI SDK를 통해 모델별 최적의 검증 방식을 자동으로 적용하는 하이브리드 접근법을 제시합니다.
OpenAI Structured Outputs vs Zod: which to use for LLM response validation in 2026↗dev.to
Dev.to2개월 전공공지능 분석AI 모델
18
LLM 스크래퍼 봇이 acme.com의 HTTPS 서버에 과부하를 일으키고 있다
LLM 스크레이퍼 봇의 과도한 HTTPS 요청으로 인해 acme.com의 서버가 과부하 및 네트워크 장애를 겪었습니다. 이는 AI 학습을 위한 공격적인 웹 크롤링이 웹 서비스의 가용성을 심각하게 저해할 수 있는 새로운 형태의 위협임을 보여줍니다.
LLM scraper bots are overloading acme.com's HTTPS server↗acme.com
Hacker News2개월 전공공지능 분석AI 모델
19
Show HN: Apple Silicon용 Gemma 4 Multimodal Fine-Tuner
Apple Silicon(Mac) 환경에서 Gemma 4 모델을 텍스트, 이미지, 오디오 등 멀티모달 데이터로 미세 조정(Fine-tuning)할 수 있는 전용 툴킷이 공개되었습니다. NVIDIA GPU 없이도 로컬 Mac에서 LoRA를 활용해 효율적인 학습이 가능하며, 클라우드(GCS/BiglarQuery) 데이터를 스트리밍하여 로컬 저장 공간의 한계를 극복할 수 있습니다.
Show HN: Gemma 4 Multimodal Fine-Tuner for Apple Silicon↗github.com
Hacker News2개월 전공공지능 분석AI 모델
20
Sonnet 4.6 오류율 상승
Anthropic의 Claude Sonnet 4.6 모델에서 오류율이 상승하는 장애가 발생했습니다. 이 장애는 Claude.ai, API, Claude Code 등 주요 서비스 전반에 영향을 미쳤으며, 현재 원인이 파악되어 수정 작업이 진행 중입니다.
Sonnet 4.6 Elevated Rate of Errors↗status.claude.com
Hacker News2개월 전공공지능 분석AI 모델
21
실행
'Doing'은 Claude Code, Codex 등 AI 에이전트를 사용하는 개발자들을 위해 음성과 스크린샷을 통한 시각적/청각적 컨텍스트를 제공하는 새로운 도구입니다. 구독 없이 로컬에서 실행되는 개인정보 보호 중심의 가벼운 유틸리티로, AI 에이전트의 작업 정확도를 높이는 데 최적화되어 있습니다.
Doing↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
22
새로운 Anthropic 모델, 모든 주요 운영 체제와 웹 브라우저에서 보안 문제 발견
Anthropic이 주요 운영 체제와 웹 브라우저에서 수천 개의 고위험 보안 취약점을 자율적으로 찾아낸 새로운 AI 모델 'Claude Mythos Preview'를 공개했습니다. 이 모델은 'Project Glasswing'의 일환으로, 보안 공격 방어를 위해 선정된 글로벌 테크 기업 및 파트너사들에게만 제한적으로 제공됩니다.
A new Anthropic model found security problems ‘in every major operating system and web browser’↗theverge.com
The Verge2개월 전공공지능 분석AI 모델
23
ConceptSeek: 영상과 텍스트에서 개념을 즉시 찾는 멀티모달 검색 도구
ConceptSeek는 유튜브, 팟캐스트, 강의 및 연구 문서 등 다양한 멀티모달 콘텐츠 내에서 특정 개념과 주제를 즉시 찾아주는 지식 베이스 검색 도구입니다. 단순 키워드 매칭을 넘어 추상적인 아이디어와 테마를 연결하며, 검색 결과에서 원본 콘텐츠의 정확한 시점으로 바로 이동할 수 있는 기능을 제공합니다.
ConceptSeek↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델