AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 5 페이지
- 0
첫인상: 저스트뷰그, 순수 C/CUDA로 구축된 나노유러 GPT-2 스케일 LLM 출시
나노유러(NanoEuler)는 PyTorch와 같은 기존 프레임워크 없이 순수 C/CUDA로만 구축된 약 1억 1,600만 파라미터 규모의 오픈소스 언어 모델입니다. 백프로파게이션부터 FlashAttention까지 모든 과정을 직접 구현하여, 외부 라이브러리 종속성 없는 투명하고 이동성이 높은 학습 스택을 제공합니다.
First Look: JustVugg Releases NanoEuler GPT-2 Scale LLM Built in Pure C/CUDA↗dev.to
- 3
AI 연산 방식 변화로 하드웨어 부담을 줄일 수 있다는 연구 결과
기존 AI 모델 경량화 방식인 양자화는 정밀도를 낮춤에 따라 정확도가 급격히 떨어지는 한계가 있었으나, SEMQ 기술은 임베딩의 의미적 관계를 보존하면서 수치적 표현을 분리하는 새로운 접근법을 제시합니다. 실험 결과, SEMQ는 기존 FP32 모델과 거의 동일한 수준의 정확도를 유지하면서도 효율적인 데이터 저장이 가능함을 입증했습니다.
Changing AI math could reduce the hardware burden, researchers show↗theregister.com
- 6
지식 어시스턴트 출시: NLWeb 기반의 신뢰할 수 있는 AI 답변
Schema App은 기업의 Content Knowledge Graph를 활용해 정확하고 인용 가능한 답변을 제공하는 'Knowledge Assistant'를 출시했습니다. 이 솔루션은 NLWeb 기술을 기반으로 검색 엔진 최적화(SEO)를 위해 구축된 구조화된 데이터를 대화형 AI 경험으로 즉시 전환하여 데이터 재사용성을 극대화합니다.
Introducing Knowledge Assistant: Trusted AI Answers Powered by NLWeb↗schemaapp.com
- 9
Anthropic의 가장 강력한 Sonnet 모델, 클로드 소넷 5가 AWS에 출시되었습니다
Anthropic의 차세대 모델인 Claude Sonnet 5가 Amazon Bedrock과 AWS 내 Claude Platform을 통해 공식 출시되었습니다. 이 모델은 Opus급에 근접한 지능을 유지하면서도 비용과 속도 면에서 최적화되어, 코딩, 에이전트 자동화 및 복잡한 데이터 분석 작업에 특화된 성능을 제공합니다.
Introducing Claude Sonnet 5 on AWS: Anthropic’s most capable Sonnet model↗aws.amazon.com
- 10
Anthropic, 최고 모델 대비 파격적인 할인 가격으로 Claude Sonnet 5 출시… 폭발적인 IPO를 향해 속도 높여
앤스로픽이 고성능과 합리적인 가격을 동시에 잡은 클로드 소네트 5를 새롭게 선보였습니다. 이번 모델은 특히 개발자들이 강력한 에이전트 기능을 활용할 수 있도록 비용 효율성을 극대화했으며, 이는 상장을 준비 중인 앤스로픽의 전략적 행보로 풀이됩니다.
Anthropic launches Claude Sonnet 5 at a steep discount to its top model as the company races toward a blockbuster IPO↗venturebeat.com
- 15
Amazon Bedrock 모델에 대한 다중 계정 접근을 관리형 권한으로 간소화
AWS는 다중 계정 환경에서 Anthropic Claude 등 외부 모델의 구독 및 권한 관리를 간소화하는 'Managed Entitlements' 기능을 소개했습니다. 중앙 관리 계정에서 한 번만 구독하면 AWS License Manager를 통해 조직 내 여러 멤버 계정에 모델 접근 권한을 안전하고 효율적으로 배포할 수 있습니다.
Simplify multi-account access to Amazon Bedrock models with managed entitlements↗aws.amazon.com
- 19
Amazon Nova 모델을 활용하여 정확한 이메일 데이터 추출하기
물류 플랫폼 Parcel Perform는 Amazon Nova 모델을 미세 조정하여 이메일 내 복잡한 데이터 추출 시 발생하는 환각 현상과 높은 비용 문제를 해결했습니다. SageMaker AI와 LoRA 기술을 활용해 정확도를 16.6%p 높이면서도 추론 지연 시간은 30% 이상 단축하고 운영 비용은 50% 절감하는 성과를 거두었습니다.
Fine-tune Amazon Nova models for accurate email data extraction↗aws.amazon.com
- 20
Google Gemini Omni Flash, API 출시로 기업 비디오 제작을 대화형으로 전환
구글의 Gemini Omni Flash API 출시로 인해 기존의 막대한 비용과 긴 시간이 소요되던 기업용 영상 제작 프로세스가 대화형 방식으로 변화할 전망입니다. 이는 기획부터 편집, 수정에 이르는 복잡한 단계를 단순화하여 텍스트 변경만으로도 즉각적인 영상 업데이트를 가능하게 합니다.
Google's Gemini Omni Flash hits the API, turning enterprise video production into a conversation↗venturebeat.com
- 23
구글, 저렴한 비용으로 4초 만에 엔터프라이즈 이미지 생성 가능한 Nano Banana 2 Lite (Gemini 3.1 Flash-Lite) 공개
구글이 비용 효율성과 속도에 최적화된 이미지 생성 모델인 Nano Banana 2 Lite(Gemini 3.1 Flash-Lite Image)를 발표했습니다. 이 모델은 건당 $0.034의 저렴한 비용으로 매우 빠른 이미지 생성 성능을 제공하여 인프라 예산이 제한적인 환경에서도 효율적인 활용이 가능합니다.
Google unveils Nano Banana 2 Lite aka Gemini 3.1 Flash-Lite for low cost, 4-second fast enterprise image generations↗venturebeat.com














