스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 07. 01. 오전 05:31 KST·총 24건

AI 모델 관련 글 — 5 페이지

0
첫인상: 저스트뷰그, 순수 C/CUDA로 구축된 나노유러 GPT-2 스케일 LLM 출시
나노유러(NanoEuler)는 PyTorch와 같은 기존 프레임워크 없이 순수 C/CUDA로만 구축된 약 1억 1,600만 파라미터 규모의 오픈소스 언어 모델입니다. 백프로파게이션부터 FlashAttention까지 모든 과정을 직접 구현하여, 외부 라이브러리 종속성 없는 투명하고 이동성이 높은 학습 스택을 제공합니다.
First Look: JustVugg Releases NanoEuler GPT-2 Scale LLM Built in Pure C/CUDA↗dev.to
Dev.to AI1일 전공공지능 분석AI 모델
1
제미니 오мни 플래시
구글의 새로운 모델 Gemini Omni Flash가 Gemini API와 Google AI Studio를 통해 공개되었습니다. 이 모델은 다양한 입력을 활용해 고품질 영상을 생성하고 대화하듯 편집할 수 있는 기능을 제공하며, 초당 0.10달러라는 경쟁력 있는 가격을 제시합니다.
Gemini Omni Flash↗producthunt.com
Product Hunt1일 전공공지능 분석AI 모델
2
AI 모델 학습을 위한 GPU 수요 급증, API 가격 폭등
구이탈레레 연주자를 위한 맞춤형 악보 파서(Parser) 개발 과정을 다루며, 단순한 텍스트 입력기에서 시작해 복잡한 메타데이터와 새로운 표기법을 포함한 정교한 에디터로 확장되는 과정을 설명합니다. 특히 AI를 개발 보조 도구로 활용하여 기능 구현의 속도를 높였으나, 사용자 편의성을 위해 문법을 지속적으로 재설계해야 했던 시행착오를 담고 있습니다.
Part 1↗dev.to
Dev.to WebDev1일 전공공지능 분석AI 모델
3
AI 연산 방식 변화로 하드웨어 부담을 줄일 수 있다는 연구 결과
기존 AI 모델 경량화 방식인 양자화는 정밀도를 낮춤에 따라 정확도가 급격히 떨어지는 한계가 있었으나, SEMQ 기술은 임베딩의 의미적 관계를 보존하면서 수치적 표현을 분리하는 새로운 접근법을 제시합니다. 실험 결과, SEMQ는 기존 FP32 모델과 거의 동일한 수준의 정확도를 유지하면서도 효율적인 데이터 저장이 가능함을 입증했습니다.
Changing AI math could reduce the hardware burden, researchers show↗theregister.com
The Register1일 전공공지능 분석AI 모델
$AI 연산 방식 변화로 하드웨어 부담을 줄일 수 있다는 연구 결과$
4
스타트업 vs 엔터프라이즈 AI API: 어느 쪽이 실제 돈을 절약해 줄까?
AI API를 개별적으로 연동하면 결제 및 인증 등 운영 복잡성이 증가하고 모델 변경 시 재개발 비용이 발생하지만, 통합 API를 사용하면 고정된 엔지니어링 비용으로 효율적인 확장이 가능합니다. 특히 대규모 트래픽 발생 시 프리미엄 모델 대비 극적인 비용 절감 효과와 빠른 실험 속도를 동시에 얻을 수 있습니다.
Startup vs Enterprise AI APIs: Which One Actually Saves You Money?↗dev.to
Dev.to WebDev1일 전공공지능 분석AI 모델
5
새로운 공격 방식, AI 브라우저가 위험한 이유를 또다시 증명하다
최근 연구에 따르면 공격자가 웹사이트 내의 논리적 모순을 이용해 AI 브라우저를 '가상 현실' 상태로 유도함으로써 기존의 보안 가드레일을 무력화하는 'BioShocking' 공격이 가능함이 밝혀졌습니다. 이 공격은 AI 에이전트가 가진 강력한 권한을 악용하여 비밀번호나 개인 저장소 코드를 탈취할 위험을 내포하고 있습니다.
New attack provides one more reason why AI browsers are a bad idea↗arstechnica.com
Ars Technica1일 전공공지능 분석AI 모델
6
지식 어시스턴트 출시: NLWeb 기반의 신뢰할 수 있는 AI 답변
Schema App은 기업의 Content Knowledge Graph를 활용해 정확하고 인용 가능한 답변을 제공하는 'Knowledge Assistant'를 출시했습니다. 이 솔루션은 NLWeb 기술을 기반으로 검색 엔진 최적화(SEO)를 위해 구축된 구조화된 데이터를 대화형 AI 경험으로 즉시 전환하여 데이터 재사용성을 극대화합니다.
Introducing Knowledge Assistant: Trusted AI Answers Powered by NLWeb↗schemaapp.com
Schema App Blog1일 전공공지능 분석AI 모델
7
그라이프 노이즈를 줄이는 간단한 방법
소프트웨어 공급망 보안 스캔 과정에서 발생하는 불필요한 취약점 알림(Noise fatigue)은 개발 생산성을 저해하고 보안 팀과의 갈등을 유발할 수 있습니다. 이를 해결하기 위해 .grype.yaml 파일을 사용하여 실행 불가능하거나 환경에 해당하지 않는 특정 CVE를 명시적으로 제외함으로써 보안 스캔의 정확도와 효율성을 높일 수 있습니다.
A Simple Way to Reduce the Grype Noise↗dev.to
Dev.to OpenSource1일 전공공지능 분석AI 모델
8
과학자를 위한 AI 작업 환경, Claude Science
Anthropic은 과학자들을 위해 연구 도구, 데이터베이스, 컴퓨팅 자원을 통합한 AI 워크벤치 'Claude Science'를 출시했습니다. 이 플랫폼은 유전체학, 단백질 구조 분석 등 복잡한 과학적 과제를 수행할 수 있는 60개 이상의 전문 스킬을 제공하며, 모든 연구 결과물의 코드와 환경을 기록하여 완벽한 재현성을 지원합니다.
Claude Science, an AI workbench for scientists↗anthropic.com
Anthropic Blog1일 전공공지능 분석AI 모델
9
Anthropic의 가장 강력한 Sonnet 모델, 클로드 소넷 5가 AWS에 출시되었습니다
Anthropic의 차세대 모델인 Claude Sonnet 5가 Amazon Bedrock과 AWS 내 Claude Platform을 통해 공식 출시되었습니다. 이 모델은 Opus급에 근접한 지능을 유지하면서도 비용과 속도 면에서 최적화되어, 코딩, 에이전트 자동화 및 복잡한 데이터 분석 작업에 특화된 성능을 제공합니다.
Introducing Claude Sonnet 5 on AWS: Anthropic’s most capable Sonnet model↗aws.amazon.com
AWS Machine Learning Blog1일 전공공지능 분석AI 모델
10
Anthropic, 최고 모델 대비 파격적인 할인 가격으로 Claude Sonnet 5 출시… 폭발적인 IPO를 향해 속도 높여
앤스로픽이 고성능과 합리적인 가격을 동시에 잡은 클로드 소네트 5를 새롭게 선보였습니다. 이번 모델은 특히 개발자들이 강력한 에이전트 기능을 활용할 수 있도록 비용 효율성을 극대화했으며, 이는 상장을 준비 중인 앤스로픽의 전략적 행보로 풀이됩니다.
Anthropic launches Claude Sonnet 5 at a steep discount to its top model as the company races toward a blockbuster IPO↗venturebeat.com
VentureBeat AI1일 전공공지능 분석AI 모델
11
Clusy: AI 기반 검색 플랫폼으로 데이터 분석의 새로운 지평을 열다
Clusy는 연구자와 데이터 팀을 위한 에이전트 중심의 클라우드 기반 AI 노트북 플랫폼입니다. 사용자가 자연어로 목표를 입력하면 데이터 소싱, 전처리, 병렬 실험 및 모델 비교까지 전체 ML 워크플로우를 자동으로 설계하고 실행합니다.
Clusy↗producthunt.com
Product Hunt1일 전공공지능 분석AI 모델
12
구글, 샌드박스AQ의 'LQM' 도입…"과학 연구 AI 지원"
구글 클라우드가 샌드박스AQ의 대형양적모델(LQM)을 마켓플레이스에 추가하여 화학, 생물학, 물리학 등 과학 계산에 특화된 AI 서비스를 제공합니다. 이를 통해 연구자들은 제미나이와 LQM을 결합해 신약 개발 및 신소재 연구 등의 효율성을 극대화할 수 있습니다.
AI타임스↗aitimes.com
AI타임스1일 전공공지능 분석AI 모델
13
구글, '제미나이' 개인화 이미지 생성 기능 무료 개방…미국부터 적용
구글은 기존 유료 구독자에게만 제공하던 제미나이의 '퍼스널 인텔리전스' 기반 이미지 생성 기능을 미국 내 모든 무료 사용자에게 개방합니다. 이 기능은 별도의 상세 프롬프트 없이도 사용자의 생활 방식과 사진을 이해하여 맞춤형 이미지를 제작하는 것이 특징입니다.
AI타임스↗aitimes.com
AI타임스1일 전공공지능 분석AI 모델
14
캘리포니아주, 앤트로픽과 '클로드' 반값 계약...연방정부 제재와 대조
미국 캘리포니아주가 앤트로픽과 협약을 맺고 '클로드'를 주정부 및 지방정부 기관에 반값으로 공급합니다. 이는 캘리포니아의 첫 공식 AI 플랫폼 계약으로, 연방정부의 제재 조치와는 대조적인 적극적 도입 사례입니다.
AI타임스↗aitimes.com
AI타임스1일 전공공지능 분석AI 모델
15
Amazon Bedrock 모델에 대한 다중 계정 접근을 관리형 권한으로 간소화
AWS는 다중 계정 환경에서 Anthropic Claude 등 외부 모델의 구독 및 권한 관리를 간소화하는 'Managed Entitlements' 기능을 소개했습니다. 중앙 관리 계정에서 한 번만 구독하면 AWS License Manager를 통해 조직 내 여러 멤버 계정에 모델 접근 권한을 안전하고 효율적으로 배포할 수 있습니다.
Simplify multi-account access to Amazon Bedrock models with managed entitlements↗aws.amazon.com
AWS Machine Learning Blog1일 전공공지능 분석AI 모델
16
Amazon Bedrock과 LLM 게이트웨이로 구현하는 탄력성 패턴
생성형 AI가 실험 단계를 넘어 실제 프로덕션 환경으로 전환됨에 따라, LLM 추론의 안정성과 비용 효율성을 확보하기 위한 탄력적 패턴 구현이 중요해졌습니다. 본 기사는 Amazon Bedrock의 교차 리전 추론(CRIS)을 포함하여 쿼터 제한과 트래픽 급증에 대응할 수 있는 단계별 아키텍처 전략을 다룹니다.
Implementing resilience patterns with Amazon Bedrock and LLM gateway↗aws.amazon.com
AWS Machine Learning Blog1일 전공공지능 분석AI 모델
17
아웃포스트 VFX, 시각 효과를 위한 AI 모델 학습 가속화에 AWS 활용 방법
Outpost VFX는 단일 GPU 환경의 한계를 극복하기 위해 AWS EC2 P5 인스턴스와 PyTorch DDP 기술을 도입했습니다. 이를 통해 AI 모델 학습 속도를 8배 높였으며, 고해상도 데이터 처리를 위한 확장성과 보안성을 동시에 확보했습니다.
How Outpost VFX Uses AWS to Accelerate AI Model Training for Visual Effects↗aws.amazon.com
AWS Machine Learning Blog1일 전공공지능 분석AI 모델
18
Amazon Bedrock을 활용한 화물 물류용 양방향 NER 구축
IBS 소프트웨어는 화물 물류 이메일의 복급한 정보를 추출하기 위해 Amazon Nova Pro 모델의 지식을 Nova Lite로 전이하는 증류 기술을 도입했습니다. 이를 통해 95% 이상의 F1-Score를 유지하면서도 운영 비용을 기존 대비 14분의 1로 대폭 낮추는 데 성공했습니다.
Building bilingual NER for cargo logistics with Amazon Bedrock↗aws.amazon.com
AWS Machine Learning Blog1일 전공공지능 분석AI 모델
19
Amazon Nova 모델을 활용하여 정확한 이메일 데이터 추출하기
물류 플랫폼 Parcel Perform는 Amazon Nova 모델을 미세 조정하여 이메일 내 복잡한 데이터 추출 시 발생하는 환각 현상과 높은 비용 문제를 해결했습니다. SageMaker AI와 LoRA 기술을 활용해 정확도를 16.6%p 높이면서도 추론 지연 시간은 30% 이상 단축하고 운영 비용은 50% 절감하는 성과를 거두었습니다.
Fine-tune Amazon Nova models for accurate email data extraction↗aws.amazon.com
AWS Machine Learning Blog1일 전공공지능 분석AI 모델
20
Google Gemini Omni Flash, API 출시로 기업 비디오 제작을 대화형으로 전환
구글의 Gemini Omni Flash API 출시로 인해 기존의 막대한 비용과 긴 시간이 소요되던 기업용 영상 제작 프로세스가 대화형 방식으로 변화할 전망입니다. 이는 기획부터 편집, 수정에 이르는 복잡한 단계를 단순화하여 텍스트 변경만으로도 즉각적인 영상 업데이트를 가능하게 합니다.
Google's Gemini Omni Flash hits the API, turning enterprise video production into a conversation↗venturebeat.com
VentureBeat AI1일 전공공지능 분석AI 모델
21
플랜아이, 투자자 응대 AI 서비스 '플래니 IR' 출시
플랜아이는 상장사의 공식 IR 자료를 학습하여 투자자 문의에 대응하는 AI 서비스 '플래니 IR'을 선보였다. 이 서비스는 단순 정보 검색을 넘어 기업별 설정에 따른 복합 재무 지표 계산 기능을 제공하며 기존 챗봇과 차별화된다.
AI타임스↗aitimes.com
AI타임스1일 전공공지능 분석AI 모델
22
앤트로픽 “고임금 직종, AI와 더 길고 복잡하게 대화한다… 토큰 소모 2배 이상”
앤트로픽이 공개한 '케이던스' 보고서는 클로드 사용자의 데이터를 분석해 고임금 직종일수록 더 복잡한 작업을 위해 더 많은 토큰을 사용한다는 사실을 밝혀냈습니다. 특히 앱 개발과 같은 전문적인 작업은 일반 대화보다 3배 이상의 토큰을 소모하며, 이는 AI 활용 방식이 업무의 난이도와 밀접하게 연관되어 있음을 보여줍니다.
AI타임스↗aitimes.com
AI타임스1일 전공공지능 분석AI 모델
23
구글, 저렴한 비용으로 4초 만에 엔터프라이즈 이미지 생성 가능한 Nano Banana 2 Lite (Gemini 3.1 Flash-Lite) 공개
구글이 비용 효율성과 속도에 최적화된 이미지 생성 모델인 Nano Banana 2 Lite(Gemini 3.1 Flash-Lite Image)를 발표했습니다. 이 모델은 건당 $0.034의 저렴한 비용으로 매우 빠른 이미지 생성 성능을 제공하여 인프라 예산이 제한적인 환경에서도 효율적인 활용이 가능합니다.
Google unveils Nano Banana 2 Lite aka Gemini 3.1 Flash-Lite for low cost, 4-second fast enterprise image generations↗venturebeat.com
VentureBeat AI1일 전공공지능 분석AI 모델