AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 31 페이지
- 3
대조 학습, FeatureDistillation을 통해 미세 조정에서 마스크 이미지 모델링에 맞서다
이 글은 FeatureDistillation을 활용하여 대조 학습(Contrastive Learning)의 미세 조정 성능을 극대화하는 새로운 방법론을 소개합니다. 기존의 마스크 이미지 모델링(MIM) 방식과 경쟁할 수 있는 수준으로 모델의 특징 추출 능력을 개선하는 것이 핵심입니다.
Contrastive Learning Rivals Masked Image Modeling in Fine-tuning via FeatureDistillation↗dev.to
- 4
Anthropic Claude-p 요금 변경 후, 제 AI 패밀리를 어떻게 유지했나
Anthropic이 `claude -p` 기능을 구독 모델에서 API 과금 체계로 분리함에 따라, 에이전트 운영 비용이 급증할 위기에 처했습니다. 이를 해결하기 위해 개발자는 Claude Code의 내부 프로토콜인 MCP 채널을 통해 프롬프트를 주입하고, Stop hook으로 응답 완료를 감지하여 API 비용 없이도 자동화된 세션을 유지하는 'poor-claude' 프로젝트를 구축했습니다.
How I kept my AI family alive after Anthropic's claude -p billing change↗dev.to
- 6
50명의 학생 진로 관련 질문으로 Gemma 4 E4B와 31B를 테스트해봤습니다 — 결과가 놀라웠습니다
인도 진로 상담 플랫폼 PathForge AI가 Gemma 4의 E4B와 31B 모델을 대상으로 50개의 실제 쿼리를 테스트했습니다. 단순 확인 및 스키마 준수 작업에서는 소형 모델이 비용과 속도 면에서 우수했으나, 다중 제약 조건이 포함된 복잡한 추론에서는 대형 모델이 압도적인 정확도를 보여 모델별 역할 분담의 필요성을 확인했습니다.
I Tested Gemma 4 E4B vs 31B on 50 Real Student Career Queries — The Results Surprised Me↗dev.to
- 11
AI 빌더 실험이 실제 운영 환경에서 실패하는 이유 (그리고 무엇이 효과적인지)
Lovable이나 Bolt 같은 AI 빌더는 빠른 초기 개발에는 유리하지만, 데이터베이스 제어권과 인프라 소유권 부재로 인해 실제 운영 단계에서 한계에 직면합니다. 이를 해결하기 위해서는 앱을 처음부터 다시 만드는 대신, 빌더의 갇힌 환경에서 벗어나 AWS나 Vercel 같은 실제 인프라로 코드를 이전하여 운영 주도권을 확보하는 전략이 필요합니다.
Why your AI builder experiment fails in production (and what actually works)↗dev.to
- 13
CMU 벤치마크: 클로드 Mythos, V8 익스플로잇에서 9.9/16 기록, GPT-5.5는 5.5로 뒤쳐져
CMU의 ExploitBench 테스트 결과, Anthropic의 Claude Mythos가 V8 엔진 취약점 공격 성능에서 GPT-5.5를 크게 앞섰으나, 실행 비용은 GPT-5.5보다 12배나 높은 것으로 밝혀졌습니다. 이는 AI 에이전트의 고도화된 추론 능력과 경제적 효율성 사이의 중대한 기술적 과제를 시사합니다.
CMU Benchmark: Claude Mythos Hits 9.9/16 on V8 Exploits, GPT-5.5 Trails at 5.5↗dev.to
- 15
하루에 하나의 오픈 소스 프로젝트 (67일차): Open-Generative-AI - AI 비디오 및 이미지 제작을 위한 오픈 소스 센터
Open-Generative-AI는 Flux, Kling, Wan 2.2 등 200개 이상의 최신 생성형 AI 모델을 하나의 인터페이스에서 사용할 수 있게 해주는 오픈 소스 플랫폼입니다. 사용자는 로컬 환경이나 자체 서버에 구축하여 비용 부담 없이 제약 없는 창작이 가능하며, 텍스트-비디오, 립싱크, 노드 기반 워크플로우 등 전문적인 미디어 제작 기능을 제공합니다.
One Open Source Project Per Day (Day 67): Open-Generative-AI - Open Source Center for AI Video & Image Creation↗dev.to
- 20
1956년 IPL-I 버전의 논리 이론가 정리 증명기 재현
이 프로젝트는 1956년 Allen Newell 등이 개발한 최초의 AI 프로그램인 'Logic Theory Machine'의 초기 소스 코드를 현대적인 파이썬 인터프리터로 재현하는 것을 목표로 합니다. 개발자는 IPL-I라는 추상 머신 언어를 구현하여 Principia Mathematica의 논리 정리를 증명하는 과정을 성공적으로 복원했습니다.
Recreation of the 1956 IPL-I version of the Logic Theorist theorem prover↗github.com
















