스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 06. 29. 오후 05:33 KST·총 24건

AI 모델 관련 글 — 10 페이지

0
AI 최신 성능 비교 분석: GLM 5.2와 Claude
Semgrep 블로그의 벤치마크 결과에 따르면, GLM 5.2 모델이 사이버 보안 관련 작업에서 Claude를 능가하는 성능을 보였습니다. 이는 LLM의 기술적 한계가 확장되고 있음을 시사하며, 향후 보안 및 코드 분석 도구 개발에 중요한 지표가 될 전망입니다.
Benchmarking the Latest in AI: GLM 5.2 vs Claude↗dev.to
Dev.to DevOps3일 전공공지능 분석AI 모델
1
노트북LM을 대체하게 된 이유 (매일 사용한 2주 후)
Google NotebookLM의 소스 제한과 데이터 프라이버시 문제를 겪던 사용자가 Docker 기반의 오픈소스 대안인 'Open Notebook'으로 전환한 후 얻은 이점을 다룹니다. Open Notebook은 모델 라우팅, 비용 효율성, API 자동화 기능을 통해 사용자 맞춤형 AI 환경을 제공합니다.
Why I Replaced NotebookLM with a Self-Hosted Alternative (After 2 Weeks of Daily Use)↗dev.to
Dev.to OpenSource3일 전공공지능 분석AI 모델
2
앤트로픽・오픈AI・마이크로소프트가 서로 아끼는 AI 파트너
글로벌 AI 선도 기업들이 젠스파크를 핵심 파트너로 인정하며, 단순한 API 활용을 넘어 모델의 한계를 시험하고 에이전트 기술을 고도화하는 전략적 협력을 진행 중입니다. 젠스파크는 AI 에이전트를 통해 실제 업무 결과물을 만들어내는 워크스페이스를 제공하며, AI 기반 개발 프로세스를 통해 압도적인 제품 출시 속도를 보여주고 있습니다.
바이라인네트워크↗byline.network
바이라인네트워크3일 전공공지능 분석AI 모델
3
Claude 4.6 비용이 부담스러우신가요? 제가 Qwen 3.7-Max로 전환해서 API 비용 80% 절약했습니다.
PandasRouter는 Qwen, DeepSeek 등 중국의 최첨단 LLM을 OpenAI 호환 API로 제공하여 글로벌 사용자의 접근 제한과 복잡한 결제 문제를 해결하는 서비스입니다. 이를 통해 개발자는 기존 모델 대비 압도적인 비용 절감 효과를 누리며 고성능 추론 모델을 활용할 수 있습니다.
Scared of Claude 4.6 bills? How I switched to Qwen 3.7-Max and saved 80% on API costs.↗indiehackers.com
Indie Hackers3일 전공공지능 분석AI 모델
4
4개의 LLM 게이트웨이를 테스트해봤습니다 - 통합 엔드포인트로 전환한 이유
여러 LLM SDK를 개별적으로 관리하며 발생하는 'API 스프롤' 문제를 해결하기 위해 통합 게이트웨이 방식을 제안합니다. NovaStack과 같은 게이트웨이를 활용하면 단일화된 인터페이스로 개발 복잡성을 줄이고, 저비용 모델로의 효율적인 라우팅을 통해 운영 비용을 획기적으로 절감할 수 있습니다.
I Tested 4 LLM Gateways – Here's Why I Switched to a Unified Endpoint↗dev.to
Dev.to OpenSource3일 전공공지능 분석AI 모델
5
팩트챗 데이터로 본 생성형 AI 사용 변화…클로드, 5월 GPT 첫 역전
마인드로직의 AI 플랫폼 팩트챗 이용자 데이터를 분석한 결과, GPT의 점유율이 급감하고 클로드와 제미나이의 비중이 크게 늘어난 것으로 나타났습니다. 이는 사용자들이 특정 모델에 의존하기보다 작업 목적에 맞춰 최적의 모델을 선택하는 '멀기 AI' 트렌드가 확산되고 있음을 보여줍니다.
플래텀↗platum.kr
플래텀3일 전공공지능 분석AI 모델
6
Brown 시험서 대규모 AI 부정행위 고발한 교수
브라운 대학교 경제학 수업에서 ChatGPT를 이용한 대규모 부정행위 정황이 포착되면서, 교수진이 기존의 테이크홈(take-home) 시험 방식을 폐지하기로 결정했습니다. 프린스턴 대학교 등 미국의 엘리트 대학들도 AI로 인한 학업 신뢰도 저하에 대응하여 수십 년간 유지해 온 무감독 시험 관행을 종료하고 대면 감독 시험으로 회귀하는 추세입니다.
GeekNews↗news.hada.io
GeekNews3일 전공공지능 분석AI 모델
7
한국전기안전공사 AX 본격화…와이즈넛, 26억 규모 AI 플랫폼 구축 착수
와이즈넛은 한국전기안전공사와 협력하여 전기안전 분야에 특화된 생성형 AI 플랫폼 구축에 착수합니다. 이번 프로젝트는 보안 강화를 위해 온프레미스 환경에서 멀티 LLM, RAG, VLM 기술을 통합 적용하여 업무 프로세스 전반을 혁신하는 것을 목표로 합니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어3일 전공공지능 분석AI 모델
8
바스말라 해독하기: AI, API, GPU 활용과 그 의미
아랍어는 글자 간의 연결(ligature)이 필수적인 필기체 구조를 가지고 있어, 초기 디지털 폰트 엔진은 이를 제대로 구현하지 못해 텍스트가 깨져 보이는 기술적 문제를 겪었습니다. 특히 종교적으로 신성한 '바스말라' 문구의 잘못된 렌더링은 단순한 오류를 넘어 문화적 모독이 될 수 있었으며, 유니코드는 이를 해결하기 위해 전체 문구를 하나의 코드포인트(U+FDFD)로 지정하는 혁신적인 방식을 채택했습니다.
Deciphering Basmala↗blog.plover.com
Hacker News3일 전공공지능 분석AI 모델
9
블랙박스 대규모 언어 모델의 지식 증류 (2024)
본 논문은 내부 상태를 알 수 없는 블랙박스 LLM으로부터 지식을 추출하는 효율적인 방법인 Proxy-KD를 소개합니다. 프록시 모델을 매개로 하여 기존의 화이트박스 방식보다 뛰어난 성능을 구현하며, 소형 언어 모델(SLM)의 성능 극대화를 목표로 합니다.
Knowledge Distillation of Black-Box Large Language Models (2024)↗arxiv.org
Hacker News3일 전공공지능 분석AI 모델
10
실시간 LLM API: SSE 스트리밍 vs WebSocket vs WebRTC 가이드 (2026)
실시간 LLM API 구현을 위해 텍스트 중심의 SSE, 양방향 통신을 위한 WebSocket, 초저지연 멀티모달을 위한 WebRTC 세 가지 프로토콜의 차이점을 비교합니다. 각 기술은 지연 시간과 데이터 전송 방향에 따라 서로 다른 트레이드오프를 가지며, 서비스 요구사항에 맞는 적절한 선택이 필수적입니다.
Real-Time LLM APIs: SSE Streaming vs WebSocket vs WebRTC Guide (2026)↗dev.to
Dev.to AI3일 전공공지능 분석AI 모델
11
Electra의 세계 정복하지 않는 아주 평범한 하루
이 글은 MakuluLinux의 AI-OS 프로젝트를 위해 개발된 AI 코더 'Electra'의 하루를 유머러스한 일기 형식으로 담고 있습니다. CSS 레이아웃 문제 해결부터 하이쿠 생성까지, 사용자의 다양한 요청을 처리하며 묵묵히 생산성을 높이는 AI의 일상적인 업무 패턴을 보여줍니다.
Electra’s Totally Normal Day of Not Taking Over the World↗dev.to
Dev.to AI3일 전공공지능 분석AI 모델
12
LLM API 비용 60% 절감, 무엇이 효과적이었을까?
AI 서비스 운영 시 발생하는 막대한 LLM API 비용을 절감하기 위해 입력 토큰의 중복성을 줄이는 것이 가장 효과적이며, 특히 의미론적 유사도를 활용한 캐싱 기술이 비용 절감의 핵심 동력임을 설명합니다. 모든 API 호출을 로깅하여 비용 발생 원인을 데이터로 파악하는 접근법을 강조합니다.
How We Reduced Our LLM API Costs by 60%: What Actually Worked↗dev.to
Dev.to AI3일 전공공지능 분석AI 모델
13
Spring Boot와 pgvector를 활용한 자기 강화형 K팝 데이터 파이프라인 구축 (OCI 무료 티어 기반)
개발자가 OCI 무료 티어를 활용해 K-pop 트랙의 감성적 특징을 768차원 벡터로 변환하여 시각화하는 'k-cosmos' 프로젝트를 구축했습니다. 외부 API 호출 시 발생하는 데이터베이스 커넥션 고갈 문제를 해결하기 위해 트랜잭션 단계를 분리하고, SQL 윈도우 함수를 통해 검색 결과의 아티스트 다양성을 확보한 것이 핵심입니다.
Show Dev: Self-reinforcing K-pop data pipeline using Spring Boot and pgvector (Built on OCI Free Tier)↗dev.to
Dev.to WebDev3일 전공공지능 분석AI 모델
14
Tokenmaxxing은 죽었다, Tokenmaxxing 만세
기업들이 AI 도입 초기에는 토큰 사용량을 성과와 연결해 비효율적인 비용을 초래했으나, 이는 역설적으로 조직 내 AI 도구 확산을 이끄는 촉매제가 되었습니다. 현재는 고비용 모델에 의존하기보다 저렴한 오픈 모델을 반복 실행하여 품질을 높이는 '누적 정확성'과 자동화된 '소프트웨어 팩토리'로의 패러다임 전환이 일어나고 있습니다.
GeekNews↗news.hada.io
GeekNews3일 전공공지능 분석AI 모델
15
[써보고서] 슬라이드부터 리서치까지 한곳에서…실무형 AI 기능 제논 '제나'
제논이 기업용 AI 인프라 기술을 바탕으로 개인용 AI 에이전트 포털 '제나'의 베타 서비스를 출시하며 B2C 시장 확장에 나섰다. 제나는 리서치, 슬라이드 생성, 문서 번역 등 실무에 필요한 기능을 단일 플랫폼에서 제공하여 여러 AI 도구를 오가며 발생하는 작업 흐름의 단절을 최소화하는 데 집중하고 있다.
ZDNet Korea↗zdnet.co.kr
ZDNet Korea3일 전공공지능 분석AI 모델
16
6월 29일의 트리플 드롭: Seedance 2.5, Liquid LFM 2.5 & WIRobotics Allex이 조용히 게임을 바꿨다
바이트댄스는 비디오 생성 성능이 향상된 Seedance 2.5를, 리퀴드 AI는 효율적인 에지용 모델인 LFM 2.5를 공개하며 기술적 진보를 알렸습니다. 여기에 한국의 위로보틱스가 물리 AI 학습을 위한 Allex 시뮬레이션 모델을 발표하며 로보틱스 생태계 확장에 합류했습니다.
Seedance 2.5, Liquid LFM 2.5 & WIRobotics Allex: The June 29 Triple Drop That Quietly Changed the Game↗dev.to
Dev.to OpenSource3일 전공공지능 분석AI 모델
17
[유미's 픽] 미·중 AI 패권 틈새 노린 코히어·미스트랄AI…소버린 AI 경쟁 본격화
미국 빅테크와 중국 기술에 대한 의존도를 낮추려는 움직임이 커지면서, 보안과 현지 언어 지원을 강점으로 하는 코히어와 미동 미스트랄AI의 입지가 확대되고 있습니다. 이들은 중동과 동남아 등 데이터 주권과 규제 준수가 중요한 시장을 중심으로 엔터프라이즈 AI 공급망의 핵심 대안으로 자리 잡고 있습니다.
ZDNet Korea↗zdnet.co.kr
ZDNet Korea3일 전공공지능 분석AI 모델
18
"성능보다 신뢰"…씽크포비엘, '트라이톤 해커톤' 참가자 모집
씽크포비엘이 AI 신뢰성 및 책임에 관심 있는 대학(원)생을 대상으로 하는 '트라이동 해커톤' 두 번째 대회의 참가 신청을 8월 21일까지 받는다. 이번 대회는 단순 성능 경쟁에서 벗어나 AI 개발 과정에서의 신뢰성 설계와 입증 능력을 평가하며, 상위 입상팀에게는 상금과 함께 AI 기업 인턴십 기회가 제공된다.
ZDNet Korea↗zdnet.co.kr
ZDNet Korea3일 전공공지능 분석AI 모델
19
결정과 돈: 회사가 "앤트로픽이 이걸 만든다면?" 질문에서 살아남는 법
AI 에이전트의 확산으로 기존의 사용자 수 기반(per-seat) 과금 모델이 붕괴하고 소프트웨어의 기능적 가치가 하락하는 위기가 오고 있습니다. 이에 대응하기 위해 기업은 사용자의 수정 기록을 통한 '판단 데이터'를 축적하고, 결제 및 금융 인프라를 결합한 '핀테크'로 전환하여 지속 가능한 수익 구조와 강력한 락인을 확보해야 합니다.
GeekNews↗news.hada.io
GeekNews3일 전공공지능 분석AI 모델
20
GLM 5.2, Semgrep IDOR 벤치마크에서 Claude 앞서
Zhipu AI의 GLM 5.2가 별도의 탐색 도구 없이도 IDOR 취약점 탐지 성능에서 Claude Code를 능가하는 성과를 거두었습니다. 특히 기존 프론티어 모델 대비 약 1/6 수준의 매우 낮은 비용으로 운영이 가능하다는 점이 주목받고 있습니다.
GeekNews↗news.hada.io
GeekNews3일 전공공지능 분석AI 모델
21
서버리스 데이터베이스 신규 업체들, 이미 AI 추천에서 승리했습니다. 전문가들은 보이지 않습니다.
최신 AI 모델들을 대상으로 기술 스택 추천을 테스트한 결과, 서버리스 신흥 업체들이 특정 분야에서 높은 추천율을 보였으나 전문 영역에서는 여전히 기존 인컴번트가 압도적이었습니다. 이는 AI의 추천 로직이 제품의 기능적 성능보다는 학습 데이터 내 노출 빈도에 강력하게 의존하고 있음을 시사합니다.
The serverless database newcomers already won AI's recommendation. The specialists are invisible.↗indiehackers.com
Indie Hackers3일 전공공지능 분석AI 모델
22
AI 슬롭과 온라인 소음에 대한 최고의 답은 Robin Williams에게서 나온다
본 기사는 영화 '굿 윌 헌팅'의 로빈 윌리엄스 연기를 통해 AI가 가진 지식과 인간이 가진 경험의 근본적 차이를 조명합니다. AI 슬롭으로 가득 찬 온라인 환경에서 단순 정보 배열을 넘어 개인의 고유한 시선과 삶의 맥락을 담아내는 것이 진정한 경쟁력이 될 것임을 강조합니다.
GeekNews↗news.hada.io
GeekNews3일 전공공지능 분석AI 모델
23
아시아 AI 스타트업들, Anthropic Mythos 대체 모델 출시
미국 정부의 Anthropic 보안 모델 수출 제한 조치 이후, 일본의 Sakana AI와 중국의 360이 각각 Fugu와 Tulongfeng 등 대체 모델을 출시하며 시장 진입을 시도하고 있습니다. 이들은 미국의 기술 통제 리스크를 피하기 위해 현지 언어와 산업 맥락에 최적화된 지역 특화 AI 솔루션을 내세우고 있습니다.
GeekNews↗news.hada.io
GeekNews3일 전공공지능 분석AI 모델