스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 07. 01. 오전 08:58 KST·총 24건

AI 모델 관련 글 — 4 페이지

0
앤스로픽 인용하기
미국 상무부가 Anthropic의 최신 모델인 Claude Fable 5 및 Mythos 5에 대한 수출 통제를 해제했습니다. 이에 따라 앤스로픽은 제한되었던 서비스 접근 권한을 곧 복구할 예정이며, 이는 글로벌 AI 기술 활용의 정상화를 의미합니다.
Quoting Anthropic↗simonwillison.net
Simon Willison1일 전공공지능 분석AI 모델
1
Phala의 프라이빗 AI 게이트웨이: 그것은 무엇이며 실제로 무엇을 하는가
기존 HTTPS 방식은 데이터 전송 중의 보안은 보장하지만 서버 내부에서의 데이터 노출 위험을 막지 못합니다. Private AI Gateway는 TEE 기반의 검증된 경로를 통해 프롬프트 내용을 암호화하고, 모든 처리 과정을 감사 가능한 영수증 형태로 기록하여 보안과 신뢰성을 극대화합니다.
Private AI Gateway by Phala: What It Is and What It Actually Does↗dev.to
Dev.to DevOps1일 전공공지능 분석AI 모델
2
모건 스탠리, AI, API, GPU 활용해 가장 위험했던 업무 절반으로 축소 – 에이전트의 자율성 감소로
모건스ernetes탠리는 금융 업무 중 정확도가 생명인 손익(P&L) 조정 프로세스에 AI 에이전트를 적용하여 업무 시간을 50% 절감했습니다. 특히 주목할 점은 완전 자율형 AI가 아닌, 인간의 판단을 반복 가능한 규칙으로 변환하는 '제한적 자율성' 모델을 통해 성공을 거두었다는 것입니다.
Morgan Stanley cut its riskiest reconciliation job in half — by making its agents less autonomous↗venturebeat.com
VentureBeat AI1일 전공공지능 분석AI 모델
3
Claude Science는 Anthropic의 최신 플래그십 제품입니다.
앤스로픽은 소프트웨어 엔지니어링을 위한 Claude Code처럼 생명과학 연구를 지원하는 독립형 제품인 'Claude Science'를 출시했습니다. 이 도구는 자율적으로 실험 코드를 실행하고 결과의 재현성을 보장하며, 특히 신약 개발 및 계산 생물학 분야에 특화된 기능을 제공합니다.
Claude Science is Anthropic’s newest flagship product↗technologyreview.com
MIT Technology Review1일 전공공지능 분석AI 모델
4
OpenAI, 2024년 50억 9천만 달러 순손실에서 2025년 385억 3천만 달러 순손실로 증가
OpenAI의 재무 제표 유출에 따르면, 2025년 예상 순손실은 전년 대비 대폭 증가한 385억 달러에 달할 것으로 전망됩니다. 이는 AI 인프라 구축과 R&D를 위한 막대한 비용 지출이 매출 성장을 압도하고 있음을 보여주며, AI 산업의 지속 가능성에 대한 회의론을 불러일으키고 있습니다.
OpenAI Went From $5.09 Billion Net Loss in 2024 to $38.53 Billion Net Loss in 2025↗cleantechnica.com
CleanTechnica1일 전공공지능 분석AI 모델
5
Claude Sonnet 5의 새로운 기능들
Anthropic이 고성능 추론 기능인 '어댑티브 싱킹'을 기본 탑재한 Claude Sonnet 5를 출시했습니다. 모델의 성능은 상위 모델에 근접했으나, 새로운 토크나이저로 인해 영어와 코드 데이터의 토큰 소모량이 급증하면서 실질적인 운영 비용은 기존보다 크게 상승할 전망입니다.
What's new in Claude Sonnet 5↗simonwillison.net
Simon Willison1일 전공공지능 분석AI 모델
6
Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image) 출시, AI 게이트웨이에서 사용 가능
Google의 초저가형 멀티모달 모델인 Nano Banana 2 Lite가 Vercel AI Gateway를 통해 공개되었습니다. 이 모델은 4초 미만의 빠른 속도로 텍스트와 이미지를 동시에 생성하며, 기존 Pro 모델 대비 약 75% 저렴한 비용으로 운영이 가능합니다.
Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image) now on AI Gateway↗vercel.com
Vercel Blog1일 전공공지능 분석AI 모델
7
Claude Sonnet 5, Vercel AI 게이트웨이에서 사용 가능
Anthropic의 Claude Sonnet 5 모델이 Vercel AI Gateway에 공식 지원됩니다. 이 모델은 이전 버전보다 코딩과 에이전트 작업 능력이 크게 향상되었으며, 기존 Opus급 성능을 Sonnet 수준의 경제적인 가격으로 제공하는 것이 핵심입니다.
Claude Sonnet 5 now available on Vercel AI Gateway↗vercel.com
Vercel Blog1일 전공공지능 분석AI 모델
8
Vercel 에이전트 가격 업데이트
Vercel Agent의 요금 체계가 기존 요청당 $0.30의 고정 방식에서 100만 토큰당 $0.25의 'Vercel Token Rate'와 모델 추론 비용을 합산하는 방식으로 변경됩니다. 이제 작업의 난이도(로그 분석, 샌드큐브 실행 등)에 따라 비용이 차등 적용되며, 기존 사용자는 30일의 유예 기간 후 자동 전환됩니다.
Vercel Agent has updated pricing↗vercel.com
Vercel Blog1일 전공공지능 분석AI 모델
9
Show HN: CPU에서 GPU 없이 124 토큰/초로 Gemma-4 26B 실행하기
이 글은 GPU 없이 i9 CPU와 DDR5 메모리만으로 대규모 MoE 모델을 고속으로 실행하는 실험 결과를 다룹니다. 저자는 출력 헤드 양자화와 추측 디코딩(Speculative Decoding)을 통해 메모리 대역폭 한계를 극복하여, 배치 처리 시 124 tokens/sec라는 놀라운 성능을 달성했습니다.
Show HN: Running Gemma-4 26B at 124 tokens/SEC on a CPU, no GPU↗apeg.dev
Hacker News Show1일 전공공지능 분석AI 모델
10
Show HN: TraceAIO - 오픈 소스 LLM 가시성 추적기
TraceAIO는 다양한 LLM(ChatGPT, Gemini, Perplexity 등)에서 자사 브랜드가 어떻게 언급되는지 실시간으로 모니터링하고 분석하는 오픈 소스 솔루션입니다. 브라우저 기반 및 API 방식을 모두 지원하여 실제 사용자가 보는 결과와 동일한 데이터를 수집하며, 경쟁사 비교 및 출처 분석 기능을 제공합니다.
Show HN: TraceAIO – open-source LLM visibility tracker↗traceaio.org
Hacker News Show1일 전공공지능 분석AI 모델
11
Show HN: 다른 모델을 쿼리하는 기술, 세컨드 오피니언
이 도구는 현재 진행 중인 AI 세션에서 떠나지 않고도 Claude Opus, Kimi 등 다른 모델에게 질문하여 두 번째 의견을 구할 수 있는 기능을 제공합니다. 컨텍스트를 자동으로 전달하며, 답변을 권위적인 결론이 아닌 비교 가능한 '동등한 관점'으로 처리하여 정보의 정확성을 높이는 데 집중합니다.
Show HN: Second opinion – A skill to query different models↗github.com
Hacker News Show1일 전공공지능 분석AI 모델
12
Show HN: fenic – 데이터프레임 연산자로서의 LLM, 의미 및 구조 질의
fenic은 LLM 기반의 추출, 분류, 요약 등의 기능을 SQL/PySpark 스타일의 연산자로 제공하는 시맨틱 데이터프레임 엔진입니다. 이를 통해 비정형 데이터를 타입이 지정된 구조적 데이터로 변환하며, 단순한 챗봇 응답을 넘어 검증 및 재사용이 가능한 지속 가능한 데이터 파이프라인 구축을 가능하게 합니다.
Show HN: fenic – LLMs as dataframe operators, query meaning and structure↗github.com
Hacker News Show1일 전공공지능 분석AI 모델
13
Show HN: 기기 최적화를 통해 로컬 LLM 속도 및 안정성 향상 방법
llm-autotune은 Ollama와 사용자 코드 사이에서 작동하는 투명 프록시로, KV 캐시 최적화 및 시스템 RAM 상태에 따른 동적 정기 조절을 통해 메모리 사용량을 줄이고 첫 토큰 생성 속도를 최대 53%까지 높여줍니다. 특히 시스템 프롬프트 캐싱과 모델 상주 기능을 통해 멀티턴 대화의 효율성을 극대화합니다.
Show HN: Makes local LLMs faster and more reliable by optimizing for your device↗autotunellm.com
Hacker News Show1일 전공공지능 분석AI 모델
14
첫인상: 저스트뷰그, 순수 C/CUDA로 구축된 나노유러 GPT-2 스케일 LLM 출시
나노유러(NanoEuler)는 PyTorch와 같은 기존 프레임워크 없이 순수 C/CUDA로만 구축된 약 1억 1,600만 파라미터 규모의 오픈소스 언어 모델입니다. 백프로파게이션부터 FlashAttention까지 모든 과정을 직접 구현하여, 외부 라이브러리 종속성 없는 투명하고 이동성이 높은 학습 스택을 제공합니다.
First Look: JustVugg Releases NanoEuler GPT-2 Scale LLM Built in Pure C/CUDA↗dev.to
Dev.to AI1일 전공공지능 분석AI 모델
15
제미니 오мни 플래시
구글의 새로운 모델 Gemini Omni Flash가 Gemini API와 Google AI Studio를 통해 공개되었습니다. 이 모델은 다양한 입력을 활용해 고품질 영상을 생성하고 대화하듯 편집할 수 있는 기능을 제공하며, 초당 0.10달러라는 경쟁력 있는 가격을 제시합니다.
Gemini Omni Flash↗producthunt.com
Product Hunt1일 전공공지능 분석AI 모델
16
AI 모델 학습을 위한 GPU 수요 급증, API 가격 폭등
구이탈레레 연주자를 위한 맞춤형 악보 파서(Parser) 개발 과정을 다루며, 단순한 텍스트 입력기에서 시작해 복잡한 메타데이터와 새로운 표기법을 포함한 정교한 에디터로 확장되는 과정을 설명합니다. 특히 AI를 개발 보조 도구로 활용하여 기능 구현의 속도를 높였으나, 사용자 편의성을 위해 문법을 지속적으로 재설계해야 했던 시행착오를 담고 있습니다.
Part 1↗dev.to
Dev.to WebDev1일 전공공지능 분석AI 모델
17
AI 연산 방식 변화로 하드웨어 부담을 줄일 수 있다는 연구 결과
기존 AI 모델 경량화 방식인 양자화는 정밀도를 낮춤에 따라 정확도가 급격히 떨어지는 한계가 있었으나, SEMQ 기술은 임베딩의 의미적 관계를 보존하면서 수치적 표현을 분리하는 새로운 접근법을 제시합니다. 실험 결과, SEMQ는 기존 FP32 모델과 거의 동일한 수준의 정확도를 유지하면서도 효율적인 데이터 저장이 가능함을 입증했습니다.
Changing AI math could reduce the hardware burden, researchers show↗theregister.com
The Register1일 전공공지능 분석AI 모델
$AI 연산 방식 변화로 하드웨어 부담을 줄일 수 있다는 연구 결과$
18
스타트업 vs 엔터프라이즈 AI API: 어느 쪽이 실제 돈을 절약해 줄까?
AI API를 개별적으로 연동하면 결제 및 인증 등 운영 복잡성이 증가하고 모델 변경 시 재개발 비용이 발생하지만, 통합 API를 사용하면 고정된 엔지니어링 비용으로 효율적인 확장이 가능합니다. 특히 대규모 트래픽 발생 시 프리미엄 모델 대비 극적인 비용 절감 효과와 빠른 실험 속도를 동시에 얻을 수 있습니다.
Startup vs Enterprise AI APIs: Which One Actually Saves You Money?↗dev.to
Dev.to WebDev1일 전공공지능 분석AI 모델
19
새로운 공격 방식, AI 브라우저가 위험한 이유를 또다시 증명하다
최근 연구에 따르면 공격자가 웹사이트 내의 논리적 모순을 이용해 AI 브라우저를 '가상 현실' 상태로 유도함으로써 기존의 보안 가드레일을 무력화하는 'BioShocking' 공격이 가능함이 밝혀졌습니다. 이 공격은 AI 에이전트가 가진 강력한 권한을 악용하여 비밀번호나 개인 저장소 코드를 탈취할 위험을 내포하고 있습니다.
New attack provides one more reason why AI browsers are a bad idea↗arstechnica.com
Ars Technica1일 전공공지능 분석AI 모델
20
지식 어시스턴트 출시: NLWeb 기반의 신뢰할 수 있는 AI 답변
Schema App은 기업의 Content Knowledge Graph를 활용해 정확하고 인용 가능한 답변을 제공하는 'Knowledge Assistant'를 출시했습니다. 이 솔루션은 NLWeb 기술을 기반으로 검색 엔진 최적화(SEO)를 위해 구축된 구조화된 데이터를 대화형 AI 경험으로 즉시 전환하여 데이터 재사용성을 극대화합니다.
Introducing Knowledge Assistant: Trusted AI Answers Powered by NLWeb↗schemaapp.com
Schema App Blog1일 전공공지능 분석AI 모델
21
그라이프 노이즈를 줄이는 간단한 방법
소프트웨어 공급망 보안 스캔 과정에서 발생하는 불필요한 취약점 알림(Noise fatigue)은 개발 생산성을 저해하고 보안 팀과의 갈등을 유발할 수 있습니다. 이를 해결하기 위해 .grype.yaml 파일을 사용하여 실행 불가능하거나 환경에 해당하지 않는 특정 CVE를 명시적으로 제외함으로써 보안 스캔의 정확도와 효율성을 높일 수 있습니다.
A Simple Way to Reduce the Grype Noise↗dev.to
Dev.to OpenSource1일 전공공지능 분석AI 모델
22
과학자를 위한 AI 작업 환경, Claude Science
Anthropic은 과학자들을 위해 연구 도구, 데이터베이스, 컴퓨팅 자원을 통합한 AI 워크벤치 'Claude Science'를 출시했습니다. 이 플랫폼은 유전체학, 단백질 구조 분석 등 복잡한 과학적 과제를 수행할 수 있는 60개 이상의 전문 스킬을 제공하며, 모든 연구 결과물의 코드와 환경을 기록하여 완벽한 재현성을 지원합니다.
Claude Science, an AI workbench for scientists↗anthropic.com
Anthropic Blog1일 전공공지능 분석AI 모델
23
Anthropic의 가장 강력한 Sonnet 모델, 클로드 소넷 5가 AWS에 출시되었습니다
Anthropic의 차세대 모델인 Claude Sonnet 5가 Amazon Bedrock과 AWS 내 Claude Platform을 통해 공식 출시되었습니다. 이 모델은 Opus급에 근접한 지능을 유지하면서도 비용과 속도 면에서 최적화되어, 코딩, 에이전트 자동화 및 복잡한 데이터 분석 작업에 특화된 성능을 제공합니다.
Introducing Claude Sonnet 5 on AWS: Anthropic’s most capable Sonnet model↗aws.amazon.com
AWS Machine Learning Blog1일 전공공지능 분석AI 모델