스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 05. 05. 오전 09:56 KST·총 24건

AI 모델 관련 글 — 49 페이지

0
13개 LLM에 대한 구분 기호 기반 프롬프트 인젝션 방어 테스트 결과
13개 LLM을 대상으로 프롬프트 인젝션 방어 실험을 진행한 결과, 구분 기호(Delimiter)를 사용하는 것이 전체 방어율을 60.7%에서 89.7%로 약 29%p 향상시키는 것으로 나타났습니다. 특히 모델별 보안 성능 격차가 매우 크며, 프롬프트 작성 시 상황을 설명하는 것보다 엄격하고 짧은 명령을 사용하는 것이 방어에 더 효과적임이 증명되었습니다.
I Tested Delimiter-Based Prompt Injection Defense Across 13 LLMs↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
1
moar
moar는 다양한 문서 형식을 AI 모델(ChatGPT, Claude, Gemini 등)에 최적화된 Markdown 또는 CSV로 변환해주는 Chrome 확장 프로그램입니다. 최대 95%의 토큰 절감 효과를 제공하며, 모든 데이터 처리가 사용자의 기기 내에서 로컬로 이루어져 강력한 개인정보 보호를 보장합니다.
Product Hunt↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
2
OpenAI의 회장은 모든 것을 다 하지만 질문에 답하는 것만 제외한다
일론 머스크와 OpenAI 간의 법적 공방에서 OpenAI 공동 창업자 그레지 브록먼의 증언과 개인 일기 내용이 공개되었습니다. 브록먼의 일기에는 비영리 모델을 영리 모델로 전환하려는 의도와 개인적 이익에 대한 고민이 담겨 있어, OpenAI의 설립 목적 훼손 및 이해상충 논란을 심화시키고 있습니다.
OpenAI’s president does ‘all the things,’ except answer a question↗theverge.com
The Verge1개월 전공공지능 분석AI 모델
3
Show HN: 1.7B Bonsai ternary 모델이 M4 Max에서 초당 442T 처리
자율형 엔지니어링 에이전트 'ata'가 작성한 커스텀 Metal 커널을 통해, Apple Silicon(M4 Max)에서 Bonsai 1.7B 모델의 추론 속도를 기존 대비 42% 향상시킨 사례입니다. 이를 통해 442 t/s라는 압도적인 토큰 생성 속도를 구현하며, AI 에이전트가 저수준(low-level) 최적화 작업을 수행할 수 있음을 증명했습니다.
Show HN: Bonsai 1.7B ternary model at 442T/s on M4 Max↗agents2agents.ai
Hacker News Show1개월 전공공지능 분석AI 모델
4
신경망과 암호화 암호는 왜 그렇게 유사할까? (2025)
신경망(Neural Networks)과 암호화 알고리즘(Cryptographic Ciphers)이 공유하는 구조적 유사성을 분석한 글입니다. 두 분야 모두 선형/비선형 층의 반복과 효율적인 데이터 믹싱(Mixing)을 통해 복잡성을 확보하며, 이는 데이터의 가역성(Invertibility)과 미분 가능성(Differentiability)이라는 유연한 제약 조건 덕분에 가능함을 설명합니다.
Why are neural networks and cryptographic ciphers so similar? (2025)↗reiner.org
Hacker News1개월 전공공지능 분석AI 모델
5
포미페러스: 가장 방대한 사과(pommes) 데이터베이스
Pomiferous는 전 세계 7,000종 이상의 사과(pommes) 품종에 대한 방대한 정보를 제공하는 전문 데이터베이스 플랫폼입니다. 수확 시기, 용도(사이드, 요리, 디저트 등), 수분 그룹 등 세분화된 검색 기능을 통해 품종별 특성을 정밀하게 탐색할 수 있는 구조를 갖추고 있습니다.
Pomiferous: The most extensive apples (pommes) database↗pomiferous.com
Hacker News1개월 전공공지능 분석AI 모델
6
지역 추론 공유에 대한 고찰: OpenAI 호환 백엔드를 갖춘 유휴 GPU 임대 마켓플레이스
클라우드 AI API의 비용 및 운영 불안정성을 해결하기 위해, 유휴 GPU 자원을 활용하여 OpenAI 호환 방식으로 추론 서비스를 제공하는 P2P 마켓플레이스 'LocalLMarket'의 개념과 기술적 구조를 다룹니다. 오픈 웨이트 모델의 성능 향상과 개인 GPU 보유량 증가가 맞물려 분산형 추론 인프라의 가능성을 제시합니다.
About Sharing Local Inference: A Marketplace for Renting Idle GPUs with an OpenAI-Compatible Backend↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
7
Claude와 MCP를 활용한 LLM 위키 구축 방법
기존의 번거로운 로컬 기반 LLM 위키 방식에서 벗어나, MCP(Model Context Protocol)를 활용해 Claude가 직접 읽고 쓸 수 있는 자동화된 지식 베이스(Hjarni 활용)를 구축하는 방법을 소개합니다. 이를 통해 사용자가 매번 맥락을 설명할 필요 없이, AI가 스스로 지식을 업데이트하고 세션 간에 누적하는 '지식의 복리 효과'를 구현할 수 있습니다.
How to build an LLM wiki with How to build an LLM wiki with Claude and MCP↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
8
이미지 AI 모델, 챗봇 업데이트를 넘어 앱 성장 견인
이미지 AI 모델 출시가 기존 텍스트 모델 업데이트보다 앱 다운로드를 약 6.5배 더 강력하게 견인하고 있습니다. 하지만 높은 다운로드 증가가 반드시 매출 증대로 이어지지는 않으며, ChatGPT를 제외한 대부분의 모델은 사용자 유입 대비 낮은 수익성을 보였습니다.
Image AI models now drive app growth, beating chatbot upgrades↗techcrunch.com
TechCrunch1개월 전공공지능 분석AI 모델
9
교육 현장에서 ChatGPT를 옹호했던 영향력 있는 연구, 문제점 발견으로 철회
ChatGPT가 학생의 학습 성과를 획기적으로 높인다는 대규모 메타 분석 연구가 데이터 분석 오류와 부적절한 연구 통합 문제로 인해 출판 약 1년 만에 철회되었습니다. 이 연구는 출판 당시 엄청난 인용 수와 소셜 미디어의 주목을 받으며 생성형 AI의 교육적 효능을 입증하는 '황금 표준'처럼 여겨졌으나, 실제로는 신뢰할 수 없는 연구들을 무리하게 결합했다는 비판을 받고 있습니다.
Influential study touting ChatGPT in education retracted over red flags↗arstechnica.com
Ars Technica1개월 전공공지능 분석AI 모델
10
넷플릭스, 머신러닝 민주화를 위한 노력: 모델 라이프사이클 그래프 구축
넷플릭스는 파편화된 ML 도메인 간의 장벽을 허물기 위해 '메타데이터 서비스(MDS)'를 통한 '모델 라이프사이클 그래프'를 구축했습니다. 이를 통해 모델, 피처, 데이터셋 등 다양한 ML 자산의 가시성을 확보하고 도메인 간 지식 공유를 촉진하는 'ML 민주화'를 추진하고 있습니다.
Democratizing Machine Learning at Netflix: Building the Model Lifecycle Graph↗netflixtechblog.com
Netflix Tech Blog1개월 전공공지능 분석AI 모델
11
Gemini API에서 Webhooks를 사용하여 장시간 작업의 마찰과 지연 감소
Gemini API가 Webhooks 기능을 도입하여 Deep Research나 비디오 생성과 같이 긴 시간이 소려는 작업의 상태를 실시간으로 알 수 있게 되었습니다. 이를 통해 개발자는 기존의 비효율적인 폴링(Polling) 방식에서 벗어나, 작업 완료 시 즉시 알림을 받는 푸시(Push) 기반의 효율적인 에이전트 애플리케이션을 구축할 수 있습니다.
Reduce friction and latency for long-running jobs with Webhooks in Gemini API↗blog.google
Google AI Blog1개월 전공공지능 분석AI 모델
12
다항식과 선형대수학으로 즐기기; 혹은, 약간의 추상적인 헛소리
이 글은 다항식과 선형대수학의 구조적 특징을 벡터 공간, 차원, 동형 사상, 몫 공간(Quotient Space) 등의 개념을 통해 수학적으로 탐구합니다. 복잡한 정리를 선형대수학적 언어로 단순화하여 재구성함으로써 수학적 구조의 아름다움과 논리적 연결성을 보여줍니다.
Fun with polynomials and linear algebra; or, slight abstract nonsense↗guille.site
Hacker News1개월 전공공지능 분석AI 모델
13
반복 사용이 RAG와 유사한 환경에서 ChatGPT 5.4의 출력에 영향을 미치는가? 실험 결과
RAG(검색 증강 생성) 환경에서 반복적인 사용자 상호작용 패턴이 ChatGPT의 출력 방식에 영향을 미칠 수 있다는 실험 결과가 발표되었습니다. 특정 테스트 패턴(비교, 필터링 등)이 실제 사용자의 질문에 대한 모델의 응답 스타일(가이드형 질문 등)에 반영된 것을 관찰하며, 이는 LLM 서비스 설계의 새로운 관점을 제시합니다.
Experiment: Does repeated usage influence ChatGPT 5.4 outputs in a RAG-like setup?↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
14
GPU 독주 흔든다…모레, 텐스토렌트 기반 LLM 추론 성능 ‘DGX급’ 입증 성공
AI 인프라 기업 '모레(More)'가 텐스토렌트(Tenstorrent) 기반 시스템에서 엔비디아 DGX A100을 상회하는 LLM 추론 성능을 입증했습니다. GPU와 NPU를 결합한 '이종 분산 서빙' 기술을 통해 고비용 HBM 의존도를 낮추고 인프라 비용 효율성을 극대화하는 새로운 대안을 제시했습니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어1개월 전공공지능 분석AI 모델
15
LLM을 545배 압축해봤습니다. 무슨 일이 일어났을까
1인 개발자가 LLM의 가중치를 매트릭스 형태가 아닌 작은 생성 네트워크(Seed)로 재구성하여 545배 압축을 시도한 실험적 여정을 다룹니다. 실험 결과, 단일 레이어 압축에는 성공했으나 다층 구조로 확장 시 발생하는 오차 누적과 MSE 손실 함수의 한계를 발견하며 모델 붕괴라는 기술적 장벽을 확인했습니다.
I Tried to Compress an LLM by 545x. Here's What Happened↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
16
마이크로벤치마킹을 통해 하드 디스크 물리적 구조 파악 (2019)
마이크로벤치마킹을 활용하여 하드 디스크를 분해하지 않고도 내부의 물리적 기하 구조를 역설계하는 기술적 방법론을 다룹니다. 현대 하드 디스크의 복잡성 증가로 인해 기존 알고리즘이 더 이상 유효하지 않음을 지적하며, 새로운 측정 접근법을 제시합니다.
Discovering Hard Disk Physical Geometry Through Microbenchmarking (2019)↗blog.stuffedcow.net
Hacker News1개월 전공공지능 분석AI 모델
17
LLM은 더 높은 수준의 추상화가 아니다
이 기사는 LLM이 C나 Python과 같은 기존 프로그래밍 언어의 '더 높은 수준의 추상화'라는 주장을 정면으로 반박합니다. 기존 언어는 입력값에 대해 결정론적인 결과(f(x) -> y)를 보장하지만, LLM은 확률적 결과(f(x) -> P(y))를 생성하며 의도하지 않은 부작용(z)을 포함할 위험이 있다는 점을 지적합니다.
LLMs Are Not a Higher Level of Abstraction↗lelanthran.com
Hacker News1개월 전공공지능 분석AI 모델
18
Atom 소개
이 문서는 XML 기반의 웹 콘텐츠 및 메타데이터 배포 표준인 Atom Syndication Format의 기술적 명세를 설명합니다. Atom 피드의 구조, 필수 및 선택적 요소(Feed/Entry Elements), 그리고 데이터 형식을 준수하기 위한 기술적 요구사항을 상세히 다룹니다.
Introduction to Atom↗validator.w3.org
Hacker News1개월 전공공지능 분석AI 모델
19
딥클로드: DeepSeek V4 Pro와 AI 에이전트 루프 결합, 비용 17배 절감
deepclaude는 Anthropic의 강력한 코딩 에이전트인 'Claude Code'의 실행 로직(Body)은 유지한 채, 모델(Brain)만 DeepSeek V4 Pro와 같은 저비용 모델로 교체하여 API 비용을 최대 17배까지 절감할 수 있게 해주는 혁신적인 도구입니다. 이를 통해 개발자는 고성능 에이전트의 기능을 누리면서도 운영 비용 부담을 획기적으로 낮출 수 있습니다.
DeepClaude – Claude Code agent loop with DeepSeek V4 Pro, 17x cheaper↗github.com
Hacker News1개월 전공공지능 분석AI 모델
20
확산 확률 모델에서 효율적으로 샘플링하는 방법
확산 확률 모델(Diffusion Models)의 고질적인 문제인 느린 생성 속도를 해결하기 위한 효율적인 샘플링 기법들을 다룹니다. 반복적인 샘플링 단계를 획기적으로 줄이면서도 고품질의 결과물을 유지할 수 있는 기술적 접근법을 설명합니다.
Learning to Efficiently Sample from Diffusion Probabilistic Models↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
21
AI 동물원 가이드: Claude.ai가 평가한 모든 모델 패밀리, 분위기에 따른 순위
이 기사는 단순한 기술적 벤치마크를 넘어, 주요 LLM(대규모 언어 모델) 패밀리들의 브랜드 정체성과 개발 전략을 '성격(Vibe)'이라는 독특한 관점에서 분류한 가이드입니다. OpenAI, Anthropic, Google, Meta 등 각 AI 기업이 가진 모델 출시 패턴, 버전 관리 방식, 그리고 사용자에게 전달되는 고유한 페르포먼스 이미지를 유머러스하게 분석하고 있습니다.
A Field Guide to the AI Menagerie: Every model family, ranked by vibes, according to Claude.ai↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
22
심층 분석: Di…와 협업 시 발생할 수 있는 함정
DiamondLinks SEO 사례를 통해 링크 빌딩 서비스의 낮은 인덱싱률(42%)이 초래하는 마케팅 비효율성과 대행사의 책임감 결여 문제를 분석합니다. 잘못된 SEO 전략은 단순한 비용 낭비를 넘어 기업의 매출 손실과 브랜드 평판 저하로 이어질 수 있음을 경고합니다.
In-Depth Analysis: The Pitfalls of Working with Di…↗dev.to
Dev.to WebDev1개월 전공공지능 분석AI 모델
23
트랜스포머와 대화하기
이 기사는 단순한 프롬프트 해킹을 넘어, LLM의 확률적 특성과 어텐션 메커니즘을 활용한 전문적인 프롬프트 엔지니어링 전략을 다룹니다. 추론 모델(Reasoning models)과 비추론 모델(Non-reasoning models)의 차이를 이해하고, 각 모델의 특성에 맞춰 도메인 언어를 사용하거나 패턴 매칭 방식으로 접근하는 구체적인 방법론을 제시합니다.
Talking to Transformers↗miraos.org
Hacker News1개월 전공공지능 분석AI 모델