AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 4 페이지
- 2
모건 스탠리, AI, API, GPU 활용해 가장 위험했던 업무 절반으로 축소 – 에이전트의 자율성 감소로
모건스ernetes탠리는 금융 업무 중 정확도가 생명인 손익(P&L) 조정 프로세스에 AI 에이전트를 적용하여 업무 시간을 50% 절감했습니다. 특히 주목할 점은 완전 자율형 AI가 아닌, 인간의 판단을 반복 가능한 규칙으로 변환하는 '제한적 자율성' 모델을 통해 성공을 거두었다는 것입니다.
Morgan Stanley cut its riskiest reconciliation job in half — by making its agents less autonomous↗venturebeat.com
- 4
OpenAI, 2024년 50억 9천만 달러 순손실에서 2025년 385억 3천만 달러 순손실로 증가
OpenAI의 재무 제표 유출에 따르면, 2025년 예상 순손실은 전년 대비 대폭 증가한 385억 달러에 달할 것으로 전망됩니다. 이는 AI 인프라 구축과 R&D를 위한 막대한 비용 지출이 매출 성장을 압도하고 있음을 보여주며, AI 산업의 지속 가능성에 대한 회의론을 불러일으키고 있습니다.
OpenAI Went From $5.09 Billion Net Loss in 2024 to $38.53 Billion Net Loss in 2025↗cleantechnica.com
- 12
Show HN: fenic – 데이터프레임 연산자로서의 LLM, 의미 및 구조 질의
fenic은 LLM 기반의 추출, 분류, 요약 등의 기능을 SQL/PySpark 스타일의 연산자로 제공하는 시맨틱 데이터프레임 엔진입니다. 이를 통해 비정형 데이터를 타입이 지정된 구조적 데이터로 변환하며, 단순한 챗봇 응답을 넘어 검증 및 재사용이 가능한 지속 가능한 데이터 파이프라인 구축을 가능하게 합니다.
Show HN: fenic – LLMs as dataframe operators, query meaning and structure↗github.com
- 13
Show HN: 기기 최적화를 통해 로컬 LLM 속도 및 안정성 향상 방법
llm-autotune은 Ollama와 사용자 코드 사이에서 작동하는 투명 프록시로, KV 캐시 최적화 및 시스템 RAM 상태에 따른 동적 정기 조절을 통해 메모리 사용량을 줄이고 첫 토큰 생성 속도를 최대 53%까지 높여줍니다. 특히 시스템 프롬프트 캐싱과 모델 상주 기능을 통해 멀티턴 대화의 효율성을 극대화합니다.
Show HN: Makes local LLMs faster and more reliable by optimizing for your device↗autotunellm.com
- 14
첫인상: 저스트뷰그, 순수 C/CUDA로 구축된 나노유러 GPT-2 스케일 LLM 출시
나노유러(NanoEuler)는 PyTorch와 같은 기존 프레임워크 없이 순수 C/CUDA로만 구축된 약 1억 1,600만 파라미터 규모의 오픈소스 언어 모델입니다. 백프로파게이션부터 FlashAttention까지 모든 과정을 직접 구현하여, 외부 라이브러리 종속성 없는 투명하고 이동성이 높은 학습 스택을 제공합니다.
First Look: JustVugg Releases NanoEuler GPT-2 Scale LLM Built in Pure C/CUDA↗dev.to
- 17
AI 연산 방식 변화로 하드웨어 부담을 줄일 수 있다는 연구 결과
기존 AI 모델 경량화 방식인 양자화는 정밀도를 낮춤에 따라 정확도가 급격히 떨어지는 한계가 있었으나, SEMQ 기술은 임베딩의 의미적 관계를 보존하면서 수치적 표현을 분리하는 새로운 접근법을 제시합니다. 실험 결과, SEMQ는 기존 FP32 모델과 거의 동일한 수준의 정확도를 유지하면서도 효율적인 데이터 저장이 가능함을 입증했습니다.
Changing AI math could reduce the hardware burden, researchers show↗theregister.com
- 19
새로운 공격 방식, AI 브라우저가 위험한 이유를 또다시 증명하다
최근 연구에 따르면 공격자가 웹사이트 내의 논리적 모순을 이용해 AI 브라우저를 '가상 현실' 상태로 유도함으로써 기존의 보안 가드레일을 무력화하는 'BioShocking' 공격이 가능함이 밝혀졌습니다. 이 공격은 AI 에이전트가 가진 강력한 권한을 악용하여 비밀번호나 개인 저장소 코드를 탈취할 위험을 내포하고 있습니다.
New attack provides one more reason why AI browsers are a bad idea↗arstechnica.com
- 20
지식 어시스턴트 출시: NLWeb 기반의 신뢰할 수 있는 AI 답변
Schema App은 기업의 Content Knowledge Graph를 활용해 정확하고 인용 가능한 답변을 제공하는 'Knowledge Assistant'를 출시했습니다. 이 솔루션은 NLWeb 기술을 기반으로 검색 엔진 최적화(SEO)를 위해 구축된 구조화된 데이터를 대화형 AI 경험으로 즉시 전환하여 데이터 재사용성을 극대화합니다.
Introducing Knowledge Assistant: Trusted AI Answers Powered by NLWeb↗schemaapp.com
- 23
Anthropic의 가장 강력한 Sonnet 모델, 클로드 소넷 5가 AWS에 출시되었습니다
Anthropic의 차세대 모델인 Claude Sonnet 5가 Amazon Bedrock과 AWS 내 Claude Platform을 통해 공식 출시되었습니다. 이 모델은 Opus급에 근접한 지능을 유지하면서도 비용과 속도 면에서 최적화되어, 코딩, 에이전트 자동화 및 복잡한 데이터 분석 작업에 특화된 성능을 제공합니다.
Introducing Claude Sonnet 5 on AWS: Anthropic’s most capable Sonnet model↗aws.amazon.com













