스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 05. 20. 오후 04:57 KST·총 24건

AI 모델 관련 글 — 26 페이지

0
인도네시아에서 14일 만에 조작 방지 AI 감사 추적 API를 구축했습니다. EU AI Act 시행까지 72일. 제가 얻은 교훈은 다음과 같습니다.
인도네시아의 18세 개발자가 AI 결정 과정을 해시 체인으로 기록하고 글로벌 규제 준수 여부를 확인하는 API 'AIDAL'을 14일 만에 개발했습니다. 그는 단순한 규제 가이드라인 제공을 넘어, 데이터의 무결성을 수학적으로 증명할 수 있는 기술적 인프라를 구축함으로써 규제 준수의 실질적인 해결책을 제시하고 있습니다.
I built a tamper-proof AI audit trail API in 14 days from Indonesia. 72 days until EU AI Act. Here's what I learned.↗indiehackers.com
Indie Hackers20일 전공공지능 분석AI 모델
1
xAI의 "For You" 피드 공개 코드
xAI의 공개된 알고리즘 저장소를 통해 'For You' 피드가 단순한 게시물 정렬을 넘어 사용자 특성 예측, 게시물 품질 점수, 광고 컨텍스트 등 다양한 메타데이터를 포함하고 있음을 확인했습니다. 이 시스템은 랭킹을 넘어 다양한 소스의 아이템을 정교하게 배치하는 데이터 전달 체계로 작동합니다.
The Public Code Behind xAI's "For You" Feed↗dev.to
Dev.to OpenSource20일 전공공지능 분석AI 모델
2
AI를 위한 두 번째 뇌
'Second Brain for AI'는 대화가 종료되면 사라지는 LLM의 단기 기억 문제를 해결하기 위해 설계된 자가 호스팅형 메모리 레이어입니다. 사용자는 프로젝트, 결정 사항, 선호도를 저장하여 Claude, ChatGPT, Cursor 등 다양한 AI 클라이언트에서 의미 기반으로 재호출할 수 있습니다.
Second Brain for AI↗producthunt.com
Product Hunt20일 전공공지능 분석AI 모델
3
구글 I/O 2026, 검색·개발도구의 ‘에이전트화’ 선언…스타트업 경쟁 기준 바뀐다
구글은 Google I/O 2026을 통해 Gemini 3.5와 Antigravity 2.0을 공개하며, AI가 사용자의 업무를 직접 수행하는 '에이전트 시대'의 개막을 알렸습니다. 검색, 개발 도구, 커머스 등 구글 생태계 전반에 에이전트 기능이 기본 탑재됨에 따라 AI 기술의 패러다임이 생성에서 실행으로 변화하고 있습니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어20일 전공공지능 분석AI 모델
4
Claude가 GA4 데이터를 직접 쿼리할 수 있도록 하여 보고서 대기 시간 줄입니다.
Smacient는 Claude가 GA4 데이터에 직접 접근하여 자연어로 쿼리를 실행할 수 있게 돕는 MCP 커넥터입니다. 사용자는 복잡한 설정 없이도 실시간 사용자 수 확인, 기간별 성과 비교, 맞춤형 지표 분석 등을 영어 질문만으로 즉시 수행할 수 있습니다.
We let Claude query your GA4 data directly so you stop waiting for reports↗indiehackers.com
Indie Hackers20일 전공공지능 분석AI 모델
5
구글 I/O 2026, 검색·개발·쇼핑까지 ‘에이전트 AI’로 재편
구글은 제미나이 3.5와 옴니 모델을 공개하며 AI가 사용자의 워크플로우 내에서 작업을 직접 수행하는 에이전트 중심 전략을 발표했습니다. 특히 개발자 플랫폼인 안티그래비티 2.0과 검색 및 쇼핑 기능의 에이전트화를 통해 AI의 역할을 단순 보조에서 실행형 인터페이스로 확장하겠다는 계획입니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어20일 전공공지능 분석AI 모델
6
Claude에게 Meta Ads 데이터를 직접 접근할 수 있는 권한을 부여하여 보고서 다운로드 작업을 중단하세요
Smacient는 Claude에 Meta Ads 계정 접근 권한을 부여하여 실시간 광고 성과 분석을 가능하게 하는 MCP 커넥터입니다. 사용자는 별도의 데이터 다운로드나 복사-붙여넣기 없이 광고 캠페인, 소재 성과, 타겟 오디언스 및 예산 최적화 제안을 AI를 통해 즉각적으로 확인할 수 있습니다.
We gave Claude direct access to Meta Ads data so you can stop downloading reports↗indiehackers.com
Indie Hackers20일 전공공지능 분석AI 모델
7
AI 청구서는 확인할 수 있지만 설명할 수 없어서, AiKey를 만들었어요
AI 서비스 운영 시 발생하는 비용 급증의 원인(중복 호출, 컨텍스트 과부하, 재시도 폭풍 등)을 파악하기 어렵다는 문제를 해결하기 위해, 요청 단위의 비용 귀속과 거버넌스를 제공하는 AiKey가 소개되었습니다. 이 도구는 단순한 비용 모니터링을 넘어 워크플로우별 비용 효율성을 분석하고 제어할 수 있는 기능을 제공합니다.
We could see our AI bill, but not explain it — so I built AiKey↗indiehackers.com
Indie Hackers21일 전공공지능 분석AI 모델
8
마이크로소프트는 1.84 피터, 구글은 0.66. '피터' 단위는 무엇인가?
'The Peter'는 솔로 개발자 @steipete의 연간 깃허브 활동량을 1단위로 설정하여 기업의 커밋, PR, 이슈 생성량을 비교하는 새로운 벤치마크 도구입니다. 단순히 전체 활동량뿐만 아니라 기여도 대비 밀도를 측정함으로써, 대규모 조직의 인원수에 의한 착시 현상을 방지하고 조직의 진정한 개발 역량을 진단합니다.
Microsoft is 1.84 Peters, Google is 0.66. What's the Peter unit?↗github.com
Hacker News21일 전공공지능 분석AI 모델
9
Gemini CLI는 2026년 6월 18일부터 작동을 중단합니다.
구글은 2026년 6월 18일부로 Gemini CLI 서비스를 종료하고, 이를 차세대 에이전트 플랫폼인 'Antigravity CLI'로 통합한다고 발표했습니다. 이번 전환은 단일 작업 중심에서 여러 에이전트가 협업하는 멀티 에이전트 환경으로의 기술적 진화를 목표로 합니다.
Gemini CLI will stop working from June 18, 2026↗developers.googleblog.com
Hacker News21일 전공공지능 분석AI 모델
10
$5/월 DigitalOcean Droplet에서 Ollama + Nginx 로드 밸런싱으로 Llama 3.2 배포하기: Claude 비용의 1/160 수준의 멀티 인스턴스 추론
고가의 LLM API 대신 오픈소스 Llama 3.2를 저렴한 VPS 인프라에 분산 배포하여 추론 비용을 최대 160배 절감하는 기술적 방법을 제시합니다. Nginx를 로드 밸런서로 활용해 여러 개의 저사양 서버를 클러스터로 묶어 확장성과 안정성을 동시에 확보하는 것이 핵심입니다.
How to Deploy Llama 3.2 with Ollama + Nginx Load Balancing on a $5/Month DigitalOcean Droplet: Multi-Instance Inference at 1/160th Claude Cost↗dev.to
Dev.to WebDev21일 전공공지능 분석AI 모델
11
$5/월 DigitalOcean Droplet에서 Llama 2 자체 호스팅하는 완벽 가이드
고가의 Claude나 ChatGPT API 대신 월 5달러의 DigitalOcean Droplet을 활용해 Llama 2를 직접 구축하는 방법을 설명합니다. 스왑(Swap) 메모리 설정을 통해 저사양 서버에서도 모델을 구동할 수 있으며, 이를 통해 API 비용을 최대 90%까지 절감할 수 있습니다.
Self-Host Llama 2 on a $5/month DigitalOcean Droplet: Complete Guide↗dev.to
Dev.to WebDev21일 전공공지능 분석AI 모델
12
findloc.ai
findloc.ai는 로컬 비즈니스가 ChatGPT, Claude, Perplexity 등 주요 AI 모델의 답변에 인용될 수 있도록 돕는 GEO(Generative Engine Optimization) 도구입니다. 스키마, FAQ, 구조화된 데이터를 포함한 미니 페이지를 무료로 생성하여 AI 검색 엔진에서의 가시성을 확보해 줍니다.
Product Hunt↗producthunt.com
Product Hunt21일 전공공지능 분석AI 모델
13
지푸AI, GLM-5V-Turbo 출시: 다중 모드 프로그래밍 모델로 '시각이 곧 코드' 새 패러다임 열어
지푸AI가 멀티모달 모델 GLM-5V-Turbo를 공개하며 이미지나 스케치를 고품질 코드로 변환하는 'Vision-as-Code' 시대를 열었습니다. 이 모델은 GPT-4o보다 높은 UI 재현율과 빠른 생성 속도를 자랑하며, 프론트엔드 개발의 자동화 수준을 한 단계 높였습니다.
智谱AI发布GLM-5V-Turbo：多模态编程模型开启'视觉即代码'新范式↗dev.to
Dev.to OpenSource21일 전공공지능 분석AI 모델
14
이제 Gmail 받은 편지함과 대화할 수 있습니다, Google IO 2026에서 공개된 것처럼
구글은 Google I/O 2026에서 Gemini AI를 활용해 이메일 내용을 대화로 조회할 수 있는 'Gmail Live' 기능을 공개했습니다. 이 기능은 키워드 검색 대신 자연어 질문을 통해 일정, 예약 정보 등 이메일에 흩어진 세부 정보를 빠르게 찾아주며, 향후 Ultra 구독자를 대상으로 출시될 예정입니다.
You can now talk to your Gmail inbox, as seen at Google IO 2026↗techcrunch.com
TechCrunch21일 전공공지능 분석AI 모델
15
Show HN: 오디오.옵저버 – AI 뉴스 진글, 원치 않아도 듣게 될 거예요
빅테크 기업들이 2026년까지 AI 인프라 및 기술 개발을 위해 7,250억 달러 규모의 대규모 투자를 계획하고 있습니다. 그러나 이러한 공격적인 투자 이면에는 수만 명의 인력을 감축하는 구조조정의 흐름이 공존하며 산업의 패러다임 변화를 예고하고 있습니다.
Show HN: audio.observer – AI news jingles you didn’t ask for↗audio.observer
Hacker News Show21일 전공공지능 분석AI 모델
16
Show HN: AI 추출 태그 및 설명으로 .AI 도메인 67,000개 검색하기
Hacker News에 공개된 이 도구는 67,000여 개의 .AI 도메인을 AI가 추출한 태그와 카테고리를 통해 쉽게 탐색할 수 있게 해줍니다. 사용자는 타겟 고객과 서비스 유형을 조합하여 방대한 AI 서비스 생태계 내에서 특정 니즈를 충족하는 사이트를 정밀하게 필터링할 수 있습니다.
Show HN: Search 67K .AI domains by AI-extracted tags and descriptions↗ratemyaisite.com
Hacker News Show21일 전공공지능 분석AI 모델
17
KV 공유, MHC, 그리고 압축된 어텐션
최신 LLM 아키텍처의 핵심 트렌드는 긴 문맥(Long-context) 처리 시 발생하는 KV 캐시 메모리 부하와 연산 비용을 줄이는 것입니다. Gemma 4의 KV 공유 기술부터 DeepSeek V4의 mHC 및 압축 어텐션까지, 다양한 구조적 혁신이 메모리 효율성을 높이는 데 집중하고 있습니다.
KV Sharing, MHC, and Compressed Attention↗magazine.sebastianraschka.com
Hacker News21일 전공공지능 분석AI 모델
18
은 백조
1773년에 제작된 정교한 기계식 오토마타 '은 백조'가 전문가들의 1,500시간에 걸친 헌신적인 복원 끝에 다시 움직이기 시작했습니다. 2,000개의 부품으로 구성된 이 걸작은 보우스 박물관에서 매일 관객들에게 그 경이로운 움직임을 선보이며 역사적 가치를 증명하고 있습니다.
The Silver Swan↗thebowesmuseum.org.uk
Hacker News21일 전공공지능 분석AI 모델
19
Gemini Omni
구글은 Gemini Omni 모델을 활용해 사실적이고 일관성 있는 결과물을 생성할 수 있도록 돕는 새로운 프롬프트 가이드를 발표했습니다. 이 가이드는 사용자가 AI의 잠적력을 최대한 끌어낼 수 있는 효율적인 프롬프트 작성법을 다룹니다.
Hacker News↗deepmind.google
Hacker News21일 전공공지능 분석AI 모델
20
Show HN: 딸기 가우시안 스플랫
3D 가우시안 스플래팅 편집 도구인 SuperSplat이 소프트웨어 속성 추적, 충돌 메쉬 생성, GPU 가속 히스토램이라는 세 가지 핵심 기능을 추가했습니다. 이를 통해 3D 데이터의 정밀한 편집과 물리적 상호작용 구현이 더욱 용이해졌습니다.
Show HN: Gaussian Splat of a Strawberry↗superspl.at
Hacker News21일 전공공지능 분석AI 모델
21
Show HN: Forge – 가드레일이 8B 모델의 에이전트 작업 성공률을 53%에서 99%로 끌어올립니다
Forge는 로컬 LLM의 도구 호출(tool-calling) 성능을 극대화하기 위해 가드레일과 컨텍스트 관리 기술을 적용한 오픈소스 프레임워크입니다. 이를 통해 8B급 소형 모델에서도 복잡한 다단계 에이전트 워크플로우의 성공률을 획기적으로 높일 수 있습니다.
Show HN: Forge – Guardrails take an 8B model from 53% to 99% on agentic tasks↗github.com
Hacker News21일 전공공지능 분석AI 모델
22
Gemini 3.5 Flash
구글은 에이전트 기능과 코딩 성능을 극대화한 새로운 모델 Gemini 3.5 Flash를 발표했습니다. 이 모델은 기존 모델 대비 4배 빠른 속도와 절반 이하의 비용으로 복잡한 장기 워크플로우를 수행하며, 개발자와 기업이 자율적인 AI 에이전트를 구축할 수 있도록 지원합니다.
Hacker News↗blog.google
Hacker News21일 전공공지능 분석AI 모델
23
대규모 언어 모델의 RLHF 심층 해부: 보상 모델링 (Part II)
이 글은 RLHF 과정 중 보상 모델을 구축하는 구체적인 방법론과 데이터 구조를 설명합니다. 특히 인간의 선호도를 수치화하는 Bradley-Terry 모델과 손실 함수 최적화 과정을 통해 모델이 어떻게 인간의 의도를 학습하는지 상세히 다룹니다.
Secrets of RLHF in Large Language Models Part II: Reward Modeling↗dev.to
Dev.to AI21일 전공공지능 분석AI 모델