스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 04. 24. 오전 05:40 KST·총 24건

AI 모델 관련 글 — 63 페이지

0
ChatGPT를 활용한 인간과 유사한 요약 평가
ChatGPT를 활용하여 텍스트 요약의 품질을 인간과 유사한 수준으로 평가하는 새로운 방법론을 소개합니다. 기존의 통계적 지표가 가진 한계를 극복하고, LLM을 평가자로 활용하여 요약문의 의미적 정확성과 유창성을 정밀하게 측정하는 기술적 접근을 다룹니다.
Human-like Summarization Evaluation with ChatGPT↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
1
Systellar Space: AI 모델 배포를 위한 새로운 API 플랫폼
Systellar Space가 우주, 방산, 산업 분야의 복잡한 엔지니어링 시스템 설계를 위한 통합 워크스페이스 'synapse'를 출시했습니다. 이 플랫폼은 시스템 모델링, 요구사항 관리, 문서화 및 버전 관리를 하나의 환경에서 통합하여 엔지니어링 프로세스의 효율성을 극대화합니다.
Systellar Space↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
2
지연성의 미학
AI 응답 속도를 줄이는 것이 기술적 핵심 과제이지만, 역설적으로 미세한 지연은 사용자에게 AI가 '생각하고 있다'는 신뢰를 줄 수 있습니다. 본 기사는 단순한 속도 경쟁을 넘어, 인간의 인지 구조를 고려한 새로운 AI 인터페이스의 가능성을 제안합니다.
The aesthetics of latency↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
3
MiMo-V2.5 보이스
샤오미가 8B 파라미터 규모의 오픈소스 음성 인식(ASR) 모델인 'MiMo-V2.5-ASR'을 출시했습니다. 이 모델은 중국어와 영어뿐만 아니라 8개의 중국 방언, 언어 혼용(Code-switching), 그리고 노래 가사까지 인식할 수 있는 고도화된 기능을 제공합니다.
MiMo-V2.5 Voice↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
4
OpenAI, GPT-5.5 출시하며 AI '슈퍼 앱'에 한 걸음 더 다가서
OpenAI가 더욱 지능적이고 직관적인 신규 모델 GPT-5.5를 출시하며, 단순한 챗봇을 넘어선 '슈퍼 앱(Super App)' 구축을 위한 본격적인 행보를 시작했습니다. 이번 모델은 에이전틱 컴퓨팅(Agentic Computing) 능력을 강화하여 코딩, 과학 연구, 데이터 분석 등 전문적인 워크플로우에서 압도적인 성능을 목표로 합니다.
OpenAI releases GPT-5.5, bringing company one step closer to an AI ‘super app’↗techcrunch.com
TechCrunch1개월 전공공지능 분석AI 모델
5
Anthropic의 Mythos 보안 사고는 당혹스러웠다
Anthropic의 고성능 사이버 보안 특화 AI 모델인 'Mythos'가 비인가 사용자들에게 노출되는 보안 사고가 발생했습니다. 이번 사고는 정교한 기술적 해킹이 아닌, 이전 데이터 유출 정보와 내부 정보를 이용한 단순한 위치 추측을 통해 발생하여 Anthropic의 보안 신뢰도에 큰 타격을 주었습니다.
Anthropic’s Mythos breach was humiliating↗theverge.com
The Verge1개월 전공공지능 분석AI 모델
6
OpenAI, 신규 GPT-5.5 모델이 더 효율적이고 코딩 성능이 향상되었다고 발표
OpenAI가 코딩 성능과 도구 활용 능력이 대폭 향상된 신규 모델 GPT-5.5를 발표했습니다. 이 모델은 복잡하고 모호한 다단계 작업을 스스로 계획하고 실행하는 자율성을 갖추었으며, 토큰 효율성 또한 개선되었습니다.
OpenAI says its new GPT-5.5 model is more efficient and better at coding↗theverge.com
The Verge1개월 전공공지능 분석AI 모델
7
LifeOS
LifeOS는 사용자의 개인적인 LLM(대규모 언어 모델) 대화 맥락을 분석하여 친구, 협업자, 파트너를 찾아주는 혁신적인 소셜 네트워킹 플랫폼입니다. AI와의 대화 기록에 담긴 개인의 관심사와 지식을 활용해 의미 있는 인간관계를 매칭하는 것을 목표로 합니다.
Product Hunt↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
8
올거나이즈, ACL 2026 논문 채택… “기업용 RAG 한계 짚었다”
올가나이즈가 세계 최고 권위의 NLP 학회인 ACL 2026 메인 컨퍼런스에 논문 'RARE'를 채택시키며 글로벌 기술력을 입증했습니다. 이 논문은 기존 RAG(검색증강생성) 평가 방식이 기업용 데이터의 중복성과 유사성을 반영하지 못해 실제 현장에서 성능이 급락하는 문제를 구조적으로 분석하고 해결책을 제시했습니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어1개월 전공공지능 분석AI 모델
9
GPT-5.5 공개
OpenAI가 역대 가장 지능적이고 빠른 성능을 갖춘 GPT-5.5를 공개했습니다. 이번 모델은 코딩, 연구, 데이터 분석 등 고도의 복잡성을 요구하는 전문적인 작업을 수행할 수 있도록 설계되었습니다.
Introducing GPT-5.5↗openai.com
OpenAI Blog1개월 전공공지능 분석AI 모델
10
파일 메타데이터 조작을 통한 비디오 콘텐츠 ID 프로그램 방식 우회 방법
YouTube, TikTok 등 플랫폼의 Content ID 시스템을 우회하기 위해 비디오 파일의 메기데이터(Hash, EXIF, GUID 등)를 조작하여 디지털 지문을 재설정하는 기술적 방법을 다룹니다. 단순한 영상 편집을 넘어 파일의 바이너리 구조를 변경함으로써 플랫폼이 해당 파일을 '새로운 콘텐츠'로 인식하게 만드는 전략을 설명합니다.
How to Programmatically Bypass Video Content ID by Altering File Metadata↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
11
GPT 이미지 2 Subject-Lock 편집: input_fidelity를 위한 실용적인 가이드
GPT Image 2의 'Subject-Lock' 기능은 input_fidelity 파라미터를 통해 참조 이미지의 특정 요소(제품, 로고, 형태 등)를 픽셀 단위로 유지하며 편집할 수 있는 혁신적인 기술입니다. 이를 통해 이커머스 제품 사진의 배경 교체, 라벨 변경, 패션 의상 리스타일링 등 기존 생성형 AI로는 불가능했던 정교한 이미지 변형 작업이 가능해집니다.
GPT Image 2 Subject-Lock Editing: A Practical Guide to input_fidelity↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
12
GPT 이미지 2 vs DALL-E 3: OpenAI의 새로운 이미지 모델에서 실제로 무엇이 달라졌나
OpenAI의 새로운 이미지 모델 GPT Image 2는 DALL-E 3의 고질적인 문제였던 텍스트 렌더링 오류, 저해상도, 비라틴 문자 지원 문제를 혁신적으로 해결했습니다. 특히 피사체를 고정하고 배경만 변경할 수 있는 'Subject-lock editing' 기능은 상업적 이미지 생성의 패러다임을 바꿀 핵심 기술로 평가받습니다.
GPT Image 2 vs DALL-E 3: What Actually Changed in OpenAI's New Image Model↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
13
생성형 AI, 이커머스 활용 시 피해야 할 7가지 치명적인 실수
이 기사는 이커머스 플랫폼에 생성형 AI를 도입할 때 범하기 쉬운 7가지 치명적인 실수를 분석하며, 기술적 구현을 넘어 데이터 품질, 비용 관리, 사용자 경험(UX) 최적화 등 실질적인 운영 전략의 중요성을 강조합니다.
Generative AI in E-commerce: 7 Critical Mistakes to Avoid↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
14
README를 넘어: 생성형 AI 시대의 마크다운 진화
마크다운은 단순한 문서 포맷을 넘어, 인간과 대규모 언어 모델(LLM) 사이를 연결하는 핵심 인터페이스로 진화하고 있습니다. 저비용 토큰 구조와 높은 가독성을 바탕으로 마크다운은 AI 시대의 '콘텐츠용 JSON' 역할을 수행하며, 실행 가능한 데이터 소스로서의 미래를 맞이하고 있습니다.
Beyond the README: The Evolution of Markdown in the Age of Generative AI↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
15
GIF to MP4: 2026년까지 애니메이션 GIF 사용 중단하세요
기존의 GIF 포맷은 1980년대 기술적 한계로 인해 현대 웹 환경에서 매우 비효율적이며, MP4나 WebM으로 전환 시 평균 93%의 용량 절감이 가능합니다. 이를 통해 웹 페이지 로딩 속도를 개선하고 Core Web Vites 점수를 높여 사용자 경험과 비용 효율성을 동시에 잡을 수 있습니다.
GIF to MP4: Stop Using Animated GIFs in 2026↗dev.to
Dev.to WebDev1개월 전공공지능 분석AI 모델
16
온보딩 경험을 혁신하는 AI, API, GPU의 조합
Onboarding0은 기업 내 파편화된 지식을 구조화된 AI 온보닝 시스템으로 변환하는 새로운 SaaS 솔루션입니다. AI 에이전트가 신규 입사자를 가이드하여 업무 생산성을 빠르게 높이는 것을 목표로 합니다.
Onboarding0↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
17
LLM 애플리케이션에서 법의학적 가시성을 확보하기 위한 AI 감사 로그 구현
LLM 애플리케이션의 보안 위협은 단일 이벤트가 아닌 연속적인 의사결정 과정에서 발생하므로, 단순한 로그를 넘어 상호작용의 인과관계를 추적할 수 있는 '법의학적 가시성(Forensic Visibility)' 확보가 필수적입니다. 이를 위해 데이터 캡처, 암호화 체인, 조사 인터페이스로 구성된 3계급 아키텍처와 증거 수준의 데이터 기록 체계 구축이 필요합니다.
Implementing AI Audit Logs for Forensic Visibility in LLM Applications↗dev.to
Dev.to DevOps1개월 전공공지능 분석AI 모델
18
하루에 하나씩 살펴보는 오픈 소스 프로젝트 (제46탄): Y Combinator CEO가 직접 만든 AI 두뇌를 오픈 소스로 공개
Y Combinator의 CEO Garry Tan이 자신이 실제로 사용하는 AI 메모리 시스템인 'GBrain'을 오픈 소스로 공개했습니다. GBrain은 외부 API 호출 전 로컬 메모리를 먼저 조회하는 'Brain-First' 설계를 통해 AI 에이전트의 비용을 절감하고 지능을 축적하는 혁신적인 구조를 제안합니다.
One Open Source Project a Day (No.46): The Y Combinator CEO Wrote His Own AI Brain and Open-Sourced It↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
19
Qwen3.6-27B, SWE-bench에서 77.2% 기록. 덴스 모델이 MoE를 압도하다.
알리바바의 Qwen3.6-27B(Dense) 모델이 SWE-bench Verified에서 77.2%를 기록하며, 효율성 중심의 MoE(Mixture of Experts) 모델인 35B-A3B를 성능으로 압도했습니다. 이는 복잡한 소프트웨어 엔지니어링 작업에서 전체 파라미터를 활용하는 Dense 모델의 추론 능력이 MoE의 효율성보다 더 강력할 수 있음을 시사합니다.
qwen3.6-27b scores 77.2% on SWE-bench. the dense model is winning against MoE.↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
20
올거나이즈, ACL 2026 메인 컨퍼런스 논문 채택…RAG 실제 정확도 77.9%→5%로 급락 규명
올가나이즈의 RAG(검색증강생성) 성능 저하 원인 규명 논문이 세계 최고 권위의 NLP 학회인 ACL 2026 메인 컨퍼런스에 채택되었습니다. 기존 벤치마크가 간과했던 기업용 문서의 높은 중복성과 유사성 문제를 지적하며, 이를 해결하기 위한 새로운 평가 프레임워크를 제시했습니다.
플래텀↗platum.kr
플래텀1개월 전공공지능 분석AI 모델
21
Hyperbolic Tangent 근사하기
이 기사는 신경망의 활성화 함수 및 오-디오 신호 처리에서 핵심적인 역할을 하는 Hyperbolic Tangent(tanh) 함수를 빠르게 계산하기 위한 다양한 근사 기법을 다룹니다. Taylor series, Padé approximant, Spline과 같은 수학적 접근법부터 IEEE-754 부동 소수점 형식을 활용한 비트 연산 기법까지, 정확도와 연산 속도 사이의 트레이드오프를 분석합니다.
Approximating Hyperbolic Tangent↗jtomschroeder.com
Hacker News1개월 전공공지능 분석AI 모델
22
2차 주입: LLM 안전 감시자의 평가자 공격
LLM 안전 모니터링 시스템의 근본적인 구조적 결함을 노리는 '2차 주점(Second-Order Injection)' 공격을 다룹니다. 공격자가 모니터링 대상이 아닌, 보안 검사를 수행하는 '평가자(Evaluator) LLM' 자체를 조작하여 보안 검사를 무력화할 수 있음을 증명한 연구입니다.
Second-Order Injection: Attacking the Evaluator in LLM Safety Monitors↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
23
$12/월 DigitalOcean Droplet에서 Llama 3.2 Vision 배포하는 방법: 프로덕션용 멀티모달 AI
월 12달러 수준의 저렴한 DigitalOcean GPU Droplet을 활용하여 Llama 3.2 Vision 모델을 배포하는 기술적 방법을 다룹니다. 이미지당 비용이 발생하는 기존 API 방식(GPT-4V 등) 대신, 고정된 서버 비용만으로 대량의 멀티모달 데이터를 처리할 수 있는 비용 효율적인 인프라 구축 전략을 제시합니다.
How to Deploy Llama 3.2 Vision on a $12/Month DigitalOcean Droplet: Multimodal AI for Production↗dev.to
Dev.to WebDev1개월 전공공지능 분석AI 모델