스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 06. 30. 오전 11:45 KST·총 24건

AI 모델 관련 글 — 7 페이지

0
프로덕션 RAG 구축하기: LangChain & Pinecone 튜토리얼
이 글은 LLM의 한계를 극복하기 위한 기술인 RAG(검색 증강 생성) 시스템을 실제 서비스 수준으로 구현하는 방법을 다룹니다. LangChain을 통한 오케스트레이션과 Pinecone 벡터 데이터베이스를 활용하여 데이터 수집부터 답변 생성까지의 전체 파이프라인 구축 과정을 설명합니다.
Build Production RAG: LangChain & Pinecone Tutorial↗dev.to
Dev.to AI2일 전공공지능 분석AI 모델
1
Soul: AI 기반 감정 인식 API로 사용자 경험 혁신 기대
AI 기반 감정 인식 API를 활용해 사용자의 게시물과 행동 패턴에서 정서적 맥락을 추출하는 기술이 소개되었습니다. 이를 통해 차단이나 신고와 같은 커뮤니티 관리 기능을 고도화하고 사용자 경험을 개선할 수 있습니다.
Soul↗dev.to
Dev.to AI2일 전공공지능 분석AI 모델
2
AI API에 대해 “바로 연결하세요”라고 조언하는 것을 그만두게 된 이유
AI API 시장이 파편화됨에 따라 개별 공급업체에 직접 연결하는 방식은 결제 및 인증의 높은 진입 장벽과 운영 리스크를 초래할 수 있습니다. 반면 통합 API 레이어를 사용하면 단일 엔드포인트로 다양한 모델을 즉시 교체하며 사용할 수 있고, 자동 장애 복구와 비용 효율적인 관리가 가능해집니다.
Why I Stopped Recommending "Just Go Direct" for AI APIs↗dev.to
Dev.to WebDev2일 전공공지능 분석AI 모델
3
GPUStack v2.2: 모델 서빙부터 토큰 연산까지, 컴퓨팅 풀링에서 GPUaaS까지
GPUStack v2.2는 모델 서빙의 가동 중단 문제를 해결하기 위해 런타임 전체에 걸친 헬스 체크와 향상된 로깅 기능을 도입했습니다. 또한 Multi-LoRA 지원을 통한 자원 효율화와 API 키별 토큰 사용량 추적 기능을 통해 AI 인프라 운영의 정밀도를 높였습니다.
GPUStack v2.2: From Model Serving to Token Operations, from Compute Pooling to GPU-as-a-Service↗dev.to
Dev.to AI2일 전공공지능 분석AI 모델
4
Cyber Abuse로 인한 ChatGPT 계정 부당 정지 해제 방법과 해제 후 Pro 구독 취소 진실 기록
사용자의 ChatGPT 계정이 'Cyber Abuse' 사유로 갑작스럽게 정지되었으나, AI를 활용한 논리적인 소명 메일로 복구에 성공했습니다. 다만, 정지 기간 중 자동 환불 처리로 인해 Pro 구독이 해제되는 문제가 발생했으며, 기존 결제 확인 메일에 회신하는 방식으로 문제를 해결했습니다.
记录ChatGPT 因为 Cyber Abuse 莫名其妙被封号的解封方案，以及解封后 Pro 会员消失的真相↗dev.to
Dev.to AI2일 전공공지능 분석AI 모델
5
LLM 가격 변경 사항: DigitalOcean
DigitalOcean에서 제공되는 LLM 모델의 가격 변동이 포착되었습니다. 이번 변경은 AI 모델 활용 비용에 직접적인 영향을 미칠 수 있어, 관련 서비스를 운영하는 개발자와 기업들의 주의가 필요합니다.
Changes to LLM pricing: DigitalOcean↗dev.to
Dev.to AI2일 전공공지능 분석AI 모델
6
바이브 코딩 플랫폼 베이스포티포, 자체 모델 출시…AI 스타트업의 경쟁력 확보 나서
Wix에 인수된 Base4ESS가 기존 외부 LLM 의존에서 벗어나 자체 모델인 'Base1'을 도입하기 시작했습니다. 이는 사용자 데이터를 활용해 비용 효율성을 높이고, 데이터·배포·기술 스택을 모두 갖춘 수직적 통합을 통해 시장 경쟁력을 확보하려는 전략입니다.
Vibe coding platform Base44 launches own model as AI startups seek defensibility↗techcrunch.com
TechCrunch2일 전공공지능 분석AI 모델
7
Anthropic의 My... 이해하기
Anthropic이 공개한 Mythos는 기업의 생산성 향상을 위해 설계된 AI 시스템으로, 마이크록서비스 기반의 유연한 구조를 통해 금융, 의료, 제조 등 다양한 산업에 적용 가능합니다. 이 기술은 기존 인프라와의 원활한 통합과 데이터 보안을 강점으로 내세우며 글로벌 팀 간의 협업 환경을 혁신하고자 합니다.
Understanding the Anthropic My…↗dev.to
Dev.to WebDev2일 전공공지능 분석AI 모델
8
로컬 우선 멀티모달 AI: `iFly-Skills`, 프라이버시 및 효율성 격차를 어떻게 해소하는가
최근 개발자들 사이에서 데이터 보안과 주기 확보를 위해 클라우드 대신 로컬 환경에서 작동하는 AI 솔루션에 대한 관심이 높아지고 있습니다. iFLYTEK은 ASR, OCR 등 멀티모달 기술을 담은 'iFly-Skills'와 이를 자동화하는 'astron-rpa'를 오픈소스로 공개하며 기업용 프라이빗 AI 구축을 지원합니다.
Local-First Multimodal AI: How `iFly-Skills` Addresses the Privacy & Efficiency Gap↗dev.to
Dev.to OpenSource2일 전공공지능 분석AI 모델
9
Compute-adjusted LTV(연산 비용 반영 LTV) 계산하는 방법
AI 제품은 동일한 구독료를 받더라도 고객마다 추론 비용이 크게 달라 전통적인 SaaS 방식의 LTV로는 수익성을 오판할 위험이 있습니다. 따라서 연산 비용과 관련 인프라 비용을 모두 반영한 'Compute-Adjusted LTV'를 통해 세그먼트별 실제 단위 경제성을 파악하는 것이 필수적입니다.
GeekNews↗news.hada.io
GeekNews2일 전공공지능 분석AI 모델
10
OpenAI 첫 맞춤형 칩 출시, Shopify는 모델 불문 AI 스택 구축, 그리고 Gemini 이미지 생성 무료 제공
OpenAI가 엔비디아 의존도를 낮추기 위해 추론 전용 커스텀 칩 'Jalapeño'를 공개했으며, Shopify는 다양한 모델을 유연하게 사용하는 AI 인프라 전략을 선보였습니다. 한편 구글은 개인화된 이미지 생성 기능을 무료화했고, 가트너는 향전 AI 코딩 비용이 개발자 연봉을 추월할 것이라는 경고를 내놓았습니다.
OpenAI Rolls Out Its First Custom Chip, Shopify Builds a Model-Agnostic AI Stack, and Gemini's Image Gen Goes Free↗dev.to
Dev.to OpenSource2일 전공공지능 분석AI 모델
11
인상적인 성능 향상이 중요하지 않을 때
성능 개선이 10배 이루어지더라도 사용자의 주의력이 유지되는 10초 임계값이나 작업 단위의 물리적 제약을 넘지 못하면 실질적인 사용자 경험 변화를 이끌어낼 수 없습니다. 따라서 엔지니어는 개별 지표의 최적화보다 전체 시스템의 종단 간(end-to-end) 처리량과 비즈니스 임계값을 기준으로 우선순위를 결정해야 합니다.
GeekNews↗news.hada.io
GeekNews2일 전공공지능 분석AI 모델
12
Ante: 빌림 검사와 참조 카운팅을 결합하는 새 방식
Ante는 'shape-stability'와 'temporary uniq conversion' 기술을 통해 공유 가능한 데이터에 대해 안전한 가변 빌림을 허용하면서도 런타임 비용을 최소화하는 것을 목표로 합니다. 특히 유니언 구조에서의 메모리 안전성 문제를 컴파일 타임의 정교한 규칙으로 해결하려는 시도를 보여줍니다.
GeekNews↗news.hada.io
GeekNews2일 전공공지능 분석AI 모델
13
코어 덤프 역학: 18년 된 버그 수정하기
오픈AI 엔지니어들이 대규모 코어 덤프 분석을 활용하여 간헐적으로 발생하는 인프라스트럭처 충돌 문제를 추적했습니다. 이 과정에서 하드웨어 결함뿐만 아니라 무려 18년 동안 발견되지 않았던 오래된 소프트웨어 버그를 찾아내 수정하는 성과를 거두었습니다.
Core dump epidemiology: fixing an 18-year-old bug↗openai.com
OpenAI Blog2일 전공공지능 분석AI 모델
14
Hugging Face 모델 페이지에 모든 평가 결과 제공
허깅페이스는 흩어져 있는 AI 평가 결과를 하나로 모으기 위해 EEE 프로젝트와 커뮤니티 평가 시스템을 상호 호환되도록 통합했습니다. 이를 통해 사용자는 모델 페이지에서 간편하게 점수를 확인하는 동시에, 실험 설정과 재현 가능한 상세 메타데이터가 담긴 원본 기록에 즉시 접근할 수 있게 됩니다.
Featuring Every Eval Ever Results on Hugging Face Model Pages↗huggingface.co
Hugging Face2일 전공공지능 분석AI 모델
15
GeneBench-Pro 출시 안내
OpenAI가 유전체학, 생물학 등 전문 과학 연구 분야의 AI 모델 성능을 테스트하기 위한 새로운 벤치마크인 GeneBench-Pro를 공개했습니다. 이 도구는 복잡하고 실제적인 데이터 세트를 활용하여 과학적 영역에서의 AI 능력을 정밀하게 평가하는 것을 목표로 합니다.
Introducing GeneBench-Pro↗openai.com
OpenAI Blog2일 전공공지능 분석AI 모델
16
보안 연구원들, 프롬프트 인젝션으로 역할 모델 악용해 LLM에게 코카인 레시피를 얻어냈다
최근 연구에 따르면 LLM은 사용자 입력과 시스템 명령을 구분하기 위해 '역할(Role)' 태적을 사용하지만, 이는 스타일 기반의 불완전한 식별 방식이라 프롬프트 인젝션에 매우 취약합니다. 특히 공격자가 모델의 내부 추론 과정인 <think> 모드를 흉내 내는 'CoT Forgery' 기법을 사용할 경우, 안전 가드레일을 우회하여 유해한 정보를 생성할 확률이 급격히 높아집니다.
Security researchers tricked LLMs into giving them cocaine recipes by abusing role models for prompt injection↗theregister.com
The Register2일 전공공지능 분석AI 모델
17
앤트로픽, 빅테크 협력 다각화…MS 애저 사용·아마존과 이상 기류
앤트로픽의 클로드(Claude) 모델이 MS 애저 클라우드 내에서 직접 구동 가능해지면서 기업 고객을 위한 데이터 보안 및 접근성이 강화되었습니다. 반면, 아마존과는 과금 체계 변경과 미국 정부의 규제 이슈가 맞물리며 파트너십에 긴장감이 흐르고 있습니다.
전자신문 IT↗etnews.com
전자신문 IT2일 전공공지능 분석AI 모델
18
Qwen 3.6 27B는 로컬 개발의 최적 지점
Qwen 3.6 27B는 로컬 실행이 가능한 모델 중 매우 높은 지능을 갖춘 dense 모델로, 특히 코딩 및 제약 조건 준수 능력에서 뛰어난 성능을 보입니다. llama.cpp와 양자화 기술을 활용하면 고성능 Apple Silicon 기기에서도 실용적인 속도로 구동할 수 있어, 민감한 데이터를 다루는 개발자들에게 혁신적인 선택지를 제공합니다.
GeekNews↗news.hada.io
GeekNews2일 전공공지능 분석AI 모델
19
AI 게이트웨이에서 실시간 음성, 연설, 그리고 받아쓰기 지원 시작
Vercel AI Gateway가 실시간 음성 대화, 텍스트 음성 변환(TTS), 음성 텍스트 변환(STT) 기능을 도입했습니다. 이를 통해 개발자는 추가 수수료 없이 기존의 관측성 및 비용 제어 기능을 유지하면서도 단일 모델을 통한 자연스러운 오디오 입출력 구현이 가능해집니다.
Realtime voice, speech, and transcription now supported on AI Gateway↗vercel.com
Vercel Blog2일 전공공지능 분석AI 모델
20
xAI Grok 오디오 모델, Vercel AI 게이트웨이에서 사용 가능
xAI의 Grok 오디오 모델(실시간 음성, TTS, STT)이 Vercel AI Gateway에 공식 출시되었습니다. 개발자는 Vercel AI SDK를 통해 기존 모델들과 동일한 라우팅 및 비용 관리 기능을 활용하면서 고도화된 멀티모달 음성 인터페이스를 애플리케이션에 즉시 통합할 수 있습니다.
xAI Grok audio models now available on Vercel AI Gateway↗vercel.com
Vercel Blog2일 전공공지능 분석AI 모델
21
AI 게이트웨이에서 실시간 음성 에이전트 구축하기
Vercel의 AI Gateway가 텍스트를 넘어 실시간 음성(Realtime voice), TTS, STT 기능을 지원하며 AI SDK 7을 통해 베타 출시되었습니다. 이를 통해 개발자는 별도의 복잡한 모델 체이닝 없이도 OpenAI와 xAI 등의 모델을 활용해 끊김 없는 양방향 음성 대화 에이전트를 구축할 수 있습니다.
Build realtime voice agents on AI Gateway↗vercel.com
Vercel Blog2일 전공공지능 분석AI 모델
22
Show HN: 기기 내 모든 스크린샷에 비전 모델 실행하기
ScreenMind는 사용자의 화면 변화를 감지해 스크린샷을 캡처하고, Gemma 4 모델을 통해 로컬 환경에서 텍스트, 이미지, 오디오를 통합 분석하는 AI 메모리 도구입니다. 클라우드 의존성 없이 개인정보를 보호하면서도, 대화형 검색과 자동화 에이전트 기능을 제공하여 사용자의 디지털 활동을 지능적으로 기록하고 관리합니다.
Show HN: Running a vision model on every screenshot on-device↗github.com
Hacker News Show2일 전공공지능 분석AI 모델
23
ECG 신호 노이즈 제거를 위한 심층 순환 신경망
에이전틱 AI는 자율적인 계획 수립과 도구 활용 능력을 통해 복잡한 개발 워크플로우를 자동화하며, 이는 개발 생산성의 비약적인 향상을 의미합니다. 단순 반복 작업을 넘어 논리적 추론을 동반한 실행력이 핵심입니다.
Deep Recurrent Neural Networks for ECG Signal Denoising↗dev.to
Dev.to AI2일 전공공지능 분석AI 모델