AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 63 페이지
- 4
OpenAI, GPT-5.5 출시하며 AI '슈퍼 앱'에 한 걸음 더 다가서
OpenAI가 더욱 지능적이고 직관적인 신규 모델 GPT-5.5를 출시하며, 단순한 챗봇을 넘어선 '슈퍼 앱(Super App)' 구축을 위한 본격적인 행보를 시작했습니다. 이번 모델은 에이전틱 컴퓨팅(Agentic Computing) 능력을 강화하여 코딩, 과학 연구, 데이터 분석 등 전문적인 워크플로우에서 압도적인 성능을 목표로 합니다.
OpenAI releases GPT-5.5, bringing company one step closer to an AI ‘super app’↗techcrunch.com
- 10
파일 메타데이터 조작을 통한 비디오 콘텐츠 ID 프로그램 방식 우회 방법
YouTube, TikTok 등 플랫폼의 Content ID 시스템을 우회하기 위해 비디오 파일의 메기데이터(Hash, EXIF, GUID 등)를 조작하여 디지털 지문을 재설정하는 기술적 방법을 다룹니다. 단순한 영상 편집을 넘어 파일의 바이너리 구조를 변경함으로써 플랫폼이 해당 파일을 '새로운 콘텐츠'로 인식하게 만드는 전략을 설명합니다.
How to Programmatically Bypass Video Content ID by Altering File Metadata↗dev.to - 11
GPT 이미지 2 Subject-Lock 편집: input_fidelity를 위한 실용적인 가이드
GPT Image 2의 'Subject-Lock' 기능은 input_fidelity 파라미터를 통해 참조 이미지의 특정 요소(제품, 로고, 형태 등)를 픽셀 단위로 유지하며 편집할 수 있는 혁신적인 기술입니다. 이를 통해 이커머스 제품 사진의 배경 교체, 라벨 변경, 패션 의상 리스타일링 등 기존 생성형 AI로는 불가능했던 정교한 이미지 변형 작업이 가능해집니다.
GPT Image 2 Subject-Lock Editing: A Practical Guide to input_fidelity↗dev.to
- 12
GPT 이미지 2 vs DALL-E 3: OpenAI의 새로운 이미지 모델에서 실제로 무엇이 달라졌나
OpenAI의 새로운 이미지 모델 GPT Image 2는 DALL-E 3의 고질적인 문제였던 텍스트 렌더링 오류, 저해상도, 비라틴 문자 지원 문제를 혁신적으로 해결했습니다. 특히 피사체를 고정하고 배경만 변경할 수 있는 'Subject-lock editing' 기능은 상업적 이미지 생성의 패러다임을 바꿀 핵심 기술로 평가받습니다.
GPT Image 2 vs DALL-E 3: What Actually Changed in OpenAI's New Image Model↗dev.to
- 17
LLM 애플리케이션에서 법의학적 가시성을 확보하기 위한 AI 감사 로그 구현
LLM 애플리케이션의 보안 위협은 단일 이벤트가 아닌 연속적인 의사결정 과정에서 발생하므로, 단순한 로그를 넘어 상호작용의 인과관계를 추적할 수 있는 '법의학적 가시성(Forensic Visibility)' 확보가 필수적입니다. 이를 위해 데이터 캡처, 암호화 체인, 조사 인터페이스로 구성된 3계급 아키텍처와 증거 수준의 데이터 기록 체계 구축이 필요합니다.
Implementing AI Audit Logs for Forensic Visibility in LLM Applications↗dev.to
- 18
하루에 하나씩 살펴보는 오픈 소스 프로젝트 (제46탄): Y Combinator CEO가 직접 만든 AI 두뇌를 오픈 소스로 공개
Y Combinator의 CEO Garry Tan이 자신이 실제로 사용하는 AI 메모리 시스템인 'GBrain'을 오픈 소스로 공개했습니다. GBrain은 외부 API 호출 전 로컬 메모리를 먼저 조회하는 'Brain-First' 설계를 통해 AI 에이전트의 비용을 절감하고 지능을 축적하는 혁신적인 구조를 제안합니다.
One Open Source Project a Day (No.46): The Y Combinator CEO Wrote His Own AI Brain and Open-Sourced It↗dev.to
- 19
Qwen3.6-27B, SWE-bench에서 77.2% 기록. 덴스 모델이 MoE를 압도하다.
알리바바의 Qwen3.6-27B(Dense) 모델이 SWE-bench Verified에서 77.2%를 기록하며, 효율성 중심의 MoE(Mixture of Experts) 모델인 35B-A3B를 성능으로 압도했습니다. 이는 복잡한 소프트웨어 엔지니어링 작업에서 전체 파라미터를 활용하는 Dense 모델의 추론 능력이 MoE의 효율성보다 더 강력할 수 있음을 시사합니다.
qwen3.6-27b scores 77.2% on SWE-bench. the dense model is winning against MoE.↗dev.to
- 23
$12/월 DigitalOcean Droplet에서 Llama 3.2 Vision 배포하는 방법: 프로덕션용 멀티모달 AI
월 12달러 수준의 저렴한 DigitalOcean GPU Droplet을 활용하여 Llama 3.2 Vision 모델을 배포하는 기술적 방법을 다룹니다. 이미지당 비용이 발생하는 기존 API 방식(GPT-4V 등) 대신, 고정된 서버 비용만으로 대량의 멀티모달 데이터를 처리할 수 있는 비용 효율적인 인프라 구축 전략을 제시합니다.
How to Deploy Llama 3.2 Vision on a $12/Month DigitalOcean Droplet: Multimodal AI for Production↗dev.to















