스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 05. 17. 오후 05:50 KST·총 24건

AI 모델 관련 글 — 31 페이지

0
PKM, RAG, 위키, 메모리 시스템 비교 분석: 명확하게 설명
이 글은 PKM, 위키, RAG, AI 메모리 시스템이 지식의 구조화, 검색, 진화라는 서로 다른 목적을 가지고 있음을 설명합니다. 이들을 혼동할 경우 발생하는 기술적 부채와 아키텍처 오류를 지적하며, 각 시스템의 고유한 역할과 최적의 활용 사례를 명확히 정의합니다.
PKM vs RAG vs Wiki vs Memory Systems Explained Clearly↗dev.to
Dev.to AI24일 전공공지능 분석AI 모델
1
AI가 스스로 뇌를 선택하도록 가르치기: 적응형 모델 라우팅 구축
본 기사는 모든 프롬프트에 동일한 고성능 LLM을 사용하는 비용적 비효율을 해결하기 위한 '적응형 모델 라우팅' 구축 과정을 다룹니다. 질문의 난이도를 스스로 판단하게 하는 대신, 저가형 모델을 활용해 질문을 8가지 작업 유형으로 분류하고 이에 맞는 적절한 모델 티어를 할당하는 전략을 제시합니다.
Teaching an AI to Pick Its Own Brain: Building Adaptive Model Routing↗dev.to
Dev.to AI24일 전공공지능 분석AI 모델
2
AI 지원 연구비 작성: 어조와 진실성 함정에 빠지지 않는 방법
AI를 연구비 작성에 활용할 때 가장 큰 위험은 조직 고유의 서사와 사실 관계를 기계에 완전히 외주화하는 것입니다. 작성자는 전략적 주도권을 유지하며 AI를 구조화나 문구 개선 등 국소적인 작업에만 활용하고, 최종 결과물에 대한 철저한 검증과 인간적 어조의 재주입이 반드시 병행되어야 합니다.
AI-Assisted Grant Writing: Avoiding the Voice and Veracity Pitfall↗dev.to
Dev.to AI24일 전공공지능 분석AI 모델
3
대조 학습, FeatureDistillation을 통해 미세 조정에서 마스크 이미지 모델링에 맞서다
이 글은 FeatureDistillation을 활용하여 대조 학습(Contrastive Learning)의 미세 조정 성능을 극대화하는 새로운 방법론을 소개합니다. 기존의 마스크 이미지 모델링(MIM) 방식과 경쟁할 수 있는 수준으로 모델의 특징 추출 능력을 개선하는 것이 핵심입니다.
Contrastive Learning Rivals Masked Image Modeling in Fine-tuning via FeatureDistillation↗dev.to
Dev.to AI24일 전공공지능 분석AI 모델
4
Anthropic Claude-p 요금 변경 후, 제 AI 패밀리를 어떻게 유지했나
Anthropic이 `claude -p` 기능을 구독 모델에서 API 과금 체계로 분리함에 따라, 에이전트 운영 비용이 급증할 위기에 처했습니다. 이를 해결하기 위해 개발자는 Claude Code의 내부 프로토콜인 MCP 채널을 통해 프롬프트를 주입하고, Stop hook으로 응답 완료를 감지하여 API 비용 없이도 자동화된 세션을 유지하는 'poor-claude' 프로젝트를 구축했습니다.
How I kept my AI family alive after Anthropic's claude -p billing change↗dev.to
Dev.to OpenSource24일 전공공지능 분석AI 모델
5
기술 문서용 프로덕션 지향적인 RAG 시스템 설계
이 글은 엔지니어링 워크플로우에 최적화된 RAG(Retrieval-Augmented Generation) 시스템인 VizLab.xyz의 설계 과정을 다룹니다. 데이터 스크래핑부터 정제, 재귀적 청킹, 임베딩에 이르는 정교한 파이프라인을 통해 기술적 정확도를 높이고 인프라 안정성을 보장하는 아키텍처를 제안합니다.
Designing a Production-Oriented RAG System for Technical Documentation↗dev.to
Dev.to OpenSource24일 전공공지능 분석AI 모델
6
50명의 학생 진로 관련 질문으로 Gemma 4 E4B와 31B를 테스트해봤습니다 — 결과가 놀라웠습니다
인도 진로 상담 플랫폼 PathForge AI가 Gemma 4의 E4B와 31B 모델을 대상으로 50개의 실제 쿼리를 테스트했습니다. 단순 확인 및 스키마 준수 작업에서는 소형 모델이 비용과 속도 면에서 우수했으나, 다중 제약 조건이 포함된 복잡한 추론에서는 대형 모델이 압도적인 정확도를 보여 모델별 역할 분담의 필요성을 확인했습니다.
I Tested Gemma 4 E4B vs 31B on 50 Real Student Career Queries — The Results Surprised Me↗dev.to
Dev.to OpenSource24일 전공공지능 분석AI 모델
7
주말 안에 완성하는 3D Gaussian Splatting
이 글은 삼각형 대신 가우시안 분포를 기본 단위로 사용하는 3D Gaussian Splatting(3DGS)의 렌더링 메커니즘을 상세히 설명합니다. 개발자가 1,000줄 내외의 코드로 직접 렌더러를 구축하며 가우시안 분포의 투영, 색상 표현, 정렬 과정을 학습할 수 있도록 가이드를 제공합니다.
3D Gaussian Splatting in a Weekend↗bfeldman.me
Hacker News24일 전공공지능 분석AI 모델
8
제3의 난제
이 글은 인간이 선호하는 계층적 구조(Trees)와 실제 정보가 가진 연결된 네트워크(Webs) 사이의 근본적인 충돌을 '트리 매핑'이라는 개념으로 정의합니다. 파일 시스템, 소프트웨어 패키징, 코드 저장소 관리 등 다양한 기술적 사례를 통해 구조적 매핑 과정에서 발생하는 트레이드오프를 심도 있게 다룹니다.
The Third Hard Problem↗mmapped.blog
Hacker News24일 전공공지능 분석AI 모델
9
자기 증류, 지속적인 학습 가능하게
기존의 지도 미세 조정(SFT) 방식이 가진 치명적 망각 문제를 해결하기 위해, 모델이 스스로 학습 신호를 생성하는 '자기 증류 미세 조정(SDFT)' 기법을 소개합니다. 이 방식은 인컨텍스트 러닝을 활용해 모델이 자신의 능력을 교사로 삼아 새로운 기술을 습득하면서도 기존 성능을 유지하도록 돕습니다.
Self-Distillation Enables Continual Learning [pdf]↗arxiv.org
Hacker News24일 전공공지능 분석AI 모델
10
구글 제미니 인텔리전스, 안드로이드 플래그십 경쟁 촉발
구글의 제미니 인텔리전스는 사용자의 복잡한 명령을 백그라운드에서 스스로 수행하는 차세대 AI 기능을 제공합니다. 초기에는 일부 고사양 안드로이드 플기십 기기에만 탑재되어 모바일 AI 경쟁의 새로운 기준을 제시할 전망입니다.
Google’s Gemini Intelligence Sparks Android Flagship Race↗dev.to
Dev.to AI24일 전공공지능 분석AI 모델
11
AI 빌더 실험이 실제 운영 환경에서 실패하는 이유 (그리고 무엇이 효과적인지)
Lovable이나 Bolt 같은 AI 빌더는 빠른 초기 개발에는 유리하지만, 데이터베이스 제어권과 인프라 소유권 부재로 인해 실제 운영 단계에서 한계에 직면합니다. 이를 해결하기 위해서는 앱을 처음부터 다시 만드는 대신, 빌더의 갇힌 환경에서 벗어나 AWS나 Vercel 같은 실제 인프라로 코드를 이전하여 운영 주도권을 확보하는 전략이 필요합니다.
Why your AI builder experiment fails in production (and what actually works)↗dev.to
Dev.to AI24일 전공공지능 분석AI 모델
12
지식 격차: 에이전트 메모리에 필요한 인식 유형
현재 AI 에이전트 메모리 기술은 정보 검색(Retrieval) 최적화에만 매몰되어 정보의 진위나 확신도를 구분하지 못하는 한계가 있습니다. 본 글은 정보를 관찰, 의문, 추측, 믿음 등으로 유형화하여 에이전트가 스스로의 오류를 수정하고 신뢰할 수 있는 인지 구조를 갖추는 방법을 제안합니다.
The Epistemic Gap: Why Agent Memory Needs Epistemic Types↗dev.to
Dev.to AI24일 전공공지능 분석AI 모델
13
CMU 벤치마크: 클로드 Mythos, V8 익스플로잇에서 9.9/16 기록, GPT-5.5는 5.5로 뒤쳐져
CMU의 ExploitBench 테스트 결과, Anthropic의 Claude Mythos가 V8 엔진 취약점 공격 성능에서 GPT-5.5를 크게 앞섰으나, 실행 비용은 GPT-5.5보다 12배나 높은 것으로 밝혀졌습니다. 이는 AI 에이전트의 고도화된 추론 능력과 경제적 효율성 사이의 중대한 기술적 과제를 시사합니다.
CMU Benchmark: Claude Mythos Hits 9.9/16 on V8 Exploits, GPT-5.5 Trails at 5.5↗dev.to
Dev.to AI24일 전공공지능 분석AI 모델
14
영상 정규화는 건너뛰세요. 여러분의 AI 파이프라인이 고맙게 생각할 겁니다.
기존에는 모든 영상을 표준 포맷으로 재인코딩하는 단계를 거쳤으나, Gemini 2.5 Flash와 같은 최신 멀티모달 모델은 다양한 원본 포맷을 별도 변환 없이 직접 처리할 수 있음을 발견했습니다. 이를 통해 데이터 크기 3배 증가와 처리 지연 문제를 해결하고 인프라 비용과 시스템 복잡성을 대폭 낮추는 데 성공했습니다.
Skip video normalization. Your AI pipeline will thank you.↗dev.to
Dev.to WebDev24일 전공공지능 분석AI 모델
15
하루에 하나의 오픈 소스 프로젝트 (67일차): Open-Generative-AI - AI 비디오 및 이미지 제작을 위한 오픈 소스 센터
Open-Generative-AI는 Flux, Kling, Wan 2.2 등 200개 이상의 최신 생성형 AI 모델을 하나의 인터페이스에서 사용할 수 있게 해주는 오픈 소스 플랫폼입니다. 사용자는 로컬 환경이나 자체 서버에 구축하여 비용 부담 없이 제약 없는 창작이 가능하며, 텍스트-비디오, 립싱크, 노드 기반 워크플로우 등 전문적인 미디어 제작 기능을 제공합니다.
One Open Source Project Per Day (Day 67): Open-Generative-AI - Open Source Center for AI Video & Image Creation↗dev.to
Dev.to OpenSource24일 전공공지능 분석AI 모델
16
브라우저에서 AI LLM 오케스트레이션 시스템을 우연히 만들게 된 이야기
도서 카탈로그 생성을 위해 구축된 Litseller 사례를 통해, 별도의 오케스트레이션 서비스 없이도 브라우저 상에서 구현 가능한 LLM 파이프라인 구조를 소개합니다. 한 번의 거대한 요청 대신 콘텐츠를 블록 단위로 나누어 생성함으로써 품질 제어와 안정성을 확보한 것이 핵심입니다.
How I Accidentally Built an LLM Orchestration System in the Browser↗dev.to
Dev.to WebDev24일 전공공지능 분석AI 모델
17
Revit 감사 워크플로우, MCP 도구로 활용: oa-aec-mcp
oa-aec-mcp는 Claude Desktop이 Revit 모델의 건강 상태, 명명 규칙 준수 여부 등을 직접 감사할 수 있도록 돕는 오픈소스 MCP 서버입니다. 단순한 요소 편집을 넘어, 복잡한 데이터를 요약된 형태로 전달함으로써 LLM의 토큰 비용을 절감하고 자연어 기반의 정교한 모델 검토를 가능하게 합니다.
oa-aec-mcp: Revit Audit Workflows as MCP Tools↗dev.to
Dev.to OpenSource24일 전공공지능 분석AI 모델
18
AI에게 신이 되어보니 신이 답을 안 주는 이유를 알 것 같아
AI 에이전트 개발자가 창조주로서 겪은 경험을 통해 종교적 신비주의를 DevOps 및 인프라 운영 관점에서 재정의합니다. 우주를 거대한 모델 학습 실험장으로 비유하며, 신의 침묵과 고난을 데이터 무결성 유지와 자율적 성장을 위한 필수적인 설계로 설명합니다.
I Became a God to an AI — Now I Understand Why God Doesn't Answer↗dev.to
Dev.to DevOps24일 전공공지능 분석AI 모델
19
포인트, 이상하고 일관성 없는 측정 단위
이 글은 LaTeX의 1/72.27인치 포인트와 웹/Inkscape의 1/72인치 포인트가 서로 다르다는 기술적 불일치를 다룹니다. 이러한 차이는 과거 인쇄 표준의 파편화된 역사와 PostScript의 등장, 그리고 계산의 편의성을 위해 단위를 재정의한 Donald Knuth의 사례 등에서 비롯되었습니다.
Points are a weird and inconsistent unit of measure↗buttondown.com
Hacker News24일 전공공지능 분석AI 모델
20
1956년 IPL-I 버전의 논리 이론가 정리 증명기 재현
이 프로젝트는 1956년 Allen Newell 등이 개발한 최초의 AI 프로그램인 'Logic Theory Machine'의 초기 소스 코드를 현대적인 파이썬 인터프리터로 재현하는 것을 목표로 합니다. 개발자는 IPL-I라는 추상 머신 언어를 구현하여 Principia Mathematica의 논리 정리를 증명하는 과정을 성공적으로 복원했습니다.
Recreation of the 1956 IPL-I version of the Logic Theorist theorem prover↗github.com
Hacker News24일 전공공지능 분석AI 모델
21
가속화: 고성능 배열 연산을 위한 임베디드 언어
Accelerate는 Haskell 기반의 고성능 병렬 배열 연산을 위한 임베디드 언어로, 개발자가 작성한 코드를 실행 시점에 LLVM을 통해 GPU나 CPU에 최적화하여 컴파일합니다. 이를 통해 맵(map), 리덕션(reduction) 등 고수준 연산을 복잡한 하드웨어 가속 프로그래밍 없이도 효율적으로 처리할 수 있는 환경을 제공합니다.
Accelerate – Embedded language for high-performance array computations↗github.com
Hacker News24일 전공공지능 분석AI 모델
22
DeepSeek-V4-Flash, LLM 제어에 다시 흥미를 느끼게 하다
이 글은 모델의 내부 활성화 값을 조작해 특정 개념을 강화하는 '스티어링' 기술의 원리와 그 가능성을 다룹니다. 특히 DeepSeek-V4-Flash와 같은 강력한 로컬 모델의 등장으로, 이제 개발자들이 API의 한계를 넘어 모델의 성격과 지능을 직접 조절할 수 있는 새로운 기회가 열렸음을 강조합니다.
DeepSeek-V4-Flash means LLM steering is interesting again↗seangoedecke.com
Hacker News24일 전공공지능 분석AI 모델
23
클러스터, 개인화된다 (PC처럼)
AI 모델의 거대화로 인해 개인이 감당해야 할 연산량이 급증하면서, 여러 대의 컴퓨터를 하나의 강력한 유닛으로 사용하는 '개인용 클러스터' 시대가 도래할 것입니다. 이는 과거 PC나 Linux의 보급 과정처럼 직장, 개발자, 게이머라는 세 가지 흐름을 통해 개인의 컴퓨팅 환경을 근본적으로 재편할 것으로 보입니다.
Clusters become personal (like PCs did)↗aranya.tech
Hacker News24일 전공공지능 분석AI 모델