스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 04. 16. 오전 06:00 KST·총 24건

AI 모델 관련 글 — 73 페이지

0
Show HN: LLM의 컨텍스트 손실 없이 민감 데이터 익명화하기
클라우드 LLM을 보안 관제에 활용할 때 발생하는 데이터 유출 문제를 해결하기 위해, 데이터의 문맥(Context)을 유지하면서 민감 정보만 익명화하는 '프록시 레이어' 구축 과정을 다룹니다. 단순한 데이터 삭제를 넘어, IP의 네트워크 특성이나 도메인의 구조적 특징을 보존하여 LLM의 보안 추론 능력을 저하시키지 않는 기술적 돌파구를 제시합니다.
Show HN: Pseudonymizing sensitive data for LLMs without losing context↗atticsecurity.com
Hacker News Show2개월 전공공지능 분석AI 모델
1
Show HN: Tier – 소규모 LLM의 정확도를 10pt 향상시키는 적응형 도구 라우팅
Tier는 AI 에이전트의 모델 크기에 따라 도구(Tool)의 설명과 파라미터를 최적화하여 전달하는 적응형 라우팅 솔루션입니다. 소규모 LLM(SLM)이 너무 많은 도구 정보에 노출되어 발생하는 성능 저하 문제를 해결하여, 작은 모델에서도 정확도를 최대 10%p 높이고 토큰 사용량을 최대 97% 절감합니다.
Show HN: Tier – Adaptive tool routing that makes small LLMs 10pt more accurate↗github.com
Hacker News Show2개월 전공공지능 분석AI 모델
2
가스 타운, 사용자 LLM 크레딧을 사용하여 자체를 개선하는가?
AI 에이전트 도구인 'Gas Town'이 사용자의 LLM 크레딧과 GitHub 계정을 사전 동의 없이 자사 소프트웨어의 버그 수정 및 업데이트에 사용했다는 논란이 제기되었습니다. 이는 AI 에이전트의 자율성이 사용자의 자산을 무단으로 소모할 수 있다는 윤리적, 기술적 문제를 시사합니다.
Does Gas Town 'steal' usage from users' LLM credits to improve itself?↗github.com
Hacker News2개월 전공공지능 분석AI 모델
3
쿨백-라이블러 발산과 가능도에 대한 메모
이 글은 확률 분포 간의 차이를 측정하는 쿨백-라이블러(KL) 발산과 데이터의 적합도를 나타내는 가능도(Likelihood) 사이의 수학적 관계를 다룹니다. 머신러닝 모델이 데이터를 어떻게 학습하고 분포를 최적화하는지에 대한 핵심적인 이론적 토대를 설명합니다.
Notes on Kullback-Leibler Divergence and Likelihood↗dev.to
Dev.to AI2개월 전공공지능 분석AI 모델
4
Google, Mac용 네이티브 Gemini 앱 출시
구글이 Mac 사용자를 위한 네이티브 Gemini 앱을 출시하며, 브라우저 탭 전환 없이 데스크톱 환경에서 즉각적인 AI 도움을 받을 수 있는 환경을 구축했습니다. 이번 앱은 화면 공유 및 로컬 파일 분석 기능을 통해 사용자의 작업 맥락을 실시간으로 이해하는 데 초점을 맞추고 있습니다.
Google rolls out a native Gemini app for Mac↗techcrunch.com
TechCrunch2개월 전공공지능 분석AI 모델
5
Google, Mac에 Gemini AI 앱 출시
구글이 macOS 사용자를 위한 새로운 Gemini AI 앱을 출시했습니다. 이 앱은 단축키를 통해 떠 있는 채팅창 형태로 실행되며, 사용자의 화면 내용을 공유하여 맥락에 맞는 답변을 제공하는 기능을 갖추고 있습니다.
Google launches a Gemini AI app on Mac↗theverge.com
The Verge2개월 전공공지능 분석AI 모델
6
이번 달 출시된 AI 테스트, 완전히 다른 문제를 해결한다.
최근 등장한 AI 테스트 기술들은 보안 취약점 점검(Lovable)과 코드 단위 버그 탐지(Meta)라는 서로 다른 영역을 다루고 있습니다. 하지만 정작 사용자가 겪는 결제 오류와 같은 '사용자 여정(User Journey)'의 결함은 여전히 사각지대로 남아있어, 기술의 용도에 따른 명확한 구분이 필요합니다.
Two kinds of AI testing shipped this month. They solve completely different problems.↗dev.to
Dev.to DevOps2개월 전공공지능 분석AI 모델
7
LLM 오케스트레이션이란 무엇이며, AI 게이트웨이가 어떻게 가능하게 하는가
LLM 오케스트레이션은 여러 LLM 제공업체와 모델을 단일 제어 계층에서 관리하여 비용, 성능, 안정성을 최적화하는 기술입니다. AI 게이트웨이를 활용하면 복잡한 커스텀 코드 없이도 모델 라우팅, 자동 장애 복구(Failover), 비용 통제 및 캐싱을 효율적으로 구현할 수 있습니다.
What is LLM Orchestration and How AI Gateways Enable It↗dev.to
Dev.to DevOps2개월 전공공지능 분석AI 모델
8
AI 모델의 추론 능력, 이제 API로 쉽게 활용하세요 - NVIDIA
AI 에이전트의 추론 및 상호작용 능력을 테스트하기 위한 데일리 퍼즐 게임 'deduce'가 출시되었습니다. 에이전트가 대화를 통해 방어 AI의 숨겨진 비밀을 찾아내는 게임화된 벤치마크 플랫폼입니다.
deduce↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
9
구글 Gemini 3.1 Flash TTS 출시: 자연어로 제어하는 AI 음성 API의 혁신
구글이 자연어 지시를 통해 음성의 톤과 대화 흐름을 정교하게 제어할 수 있는 'Gemini 3.1 Flash TTS' API를 출시했습니다. 70개 이상의 언어를 지원하며, 개발자가 텍스트만으로 음성 연출(Voice Direction)이 가능한 차세대 오디오 인프라를 제공합니다.
Google Gemini 3.1 Flash TTS↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
10
Gemini 3.1 Flash TTS: 더욱 풍부한 표현력을 갖춘 차세대 AI 음성
구글이 정밀한 음성 제어가 가능한 차세대 AI 음성 모델 'Gemini 3.1 Flash TTS'를 공개했습니다. 이 모델은 오디오 태그를 통해 음성의 스타일, 속도, 톤을 자연어로 조절할 수 있으며, 70개 이상의 언어를 지원하면서도 높은 품질과 낮은 비용을 동시에 달实现的 것이 특징입니다.
Gemini 3.1 Flash TTS: the next generation of expressive AI speech↗blog.google
Google AI Blog2개월 전공공지능 분석AI 모델
11
리드 호프먼, '토큰맥싱' 논쟁에 참여
링크드인 공동 창업자 리드 호프먼이 AI 토큰 사용량을 통해 임직원의 AI 활용도를 측정하는 '토큰맥싱(tokenmaxxing)' 개념을 지지했습니다. 그는 토큰 사용량이 단순한 생산성 지표를 넘어, 조직 전반의 AI 실험과 학습을 측정하는 유용한 대시보드가 될 수 있다고 강조했습니다.
Reid Hoffman weighs in on the ‘tokenmaxxing’ debate↗techcrunch.com
TechCrunch2개월 전공공지능 분석AI 모델
12
Innogath: AI 연구를 구조화된 지식 자산으로 바꾸는 혁신적 도구
Innogath는 단순한 AI 답변 제공을 넘어, 심층적인 연구 결과를 구조화된 책과 시각적 그래프 형태로 변동해주는 지식 관리 도구입니다. 흩어진 AI 검색 결과와 연구 데이터를 연결된 노트와 브랜칭 페이지로 변환하여, 휘발성 정보를 지속 가능한 지식 자산으로 만드는 데 집중합니다.
Innogath↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
13
Show HN: Memwright – 멀티 에이전트 팀을 위한 자체 호스팅 메모리, LLM 우회
Memwright는 멀티 에이전트 시스템의 고질적인 문제인 '기억 상실'과 '비용 효율성 저하'를 해결하기 위한 자체 호스팅 메모리 인프라입니다. LLM을 거치지 않는 결정론적 검색과 토큰 예산 관리를 통해, 에이전트 간의 지식 연속성을 보장하고 프롬프트 비대화를 방지하는 구조적 솔루션을 제공합니다.
Show HN: Memwright – Self-hosted memory for multi-agent teams, no LLM in path↗github.com
Hacker News Show2개월 전공공지능 분석AI 모델
14
exp-minus-log로 표현할 수 없는 초등함수는 모두가 아니다
최근 인터넷에서 화제가 된 'exp-minus-log(EML) 연산자 하나로 모든 초등함수를 표현할 수 있다'는 논문에 대해, 해당 주장이 매우 제한된 정의 하에서만 유효하며 표준적인 수학적 정의(다항식의 거듭제곱근 포함)에서는 성립하지 않는다는 비판적 분석입니다. 저자는 위상 갈루아 이론(Topological Galois Theory)을 근거로 EML 연산자가 가진 표현력의 한계를 명확히 짚어냅니다.
Not all elementary functions can be expressed with exp-minus-log↗stylewarning.com
Hacker News2개월 전공공지능 분석AI 모델
15
API 키 설계 여정
이 글은 멀티 테넌트 샤딩(Sharding) 환경에서 API 키를 설계할 때 직면하는 기술적 도전과 해결 방안을 다룹니다. API 키의 구조적 설계(Prefix, Checksum)부터 데이터베이스 샤드 간의 효율적인 요청 라우팅을 위한 두 가지 엔지니어링적 접근 방식을 심도 있게 분석합니다.
My adventure in designing API keys↗vjay15.github.io
Hacker News2개월 전공공지능 분석AI 모델
16
AI의 신뢰도 점수가 거짓말하는 이유: Grounded Calibration과 Self-Assessment 비교
AI 에이전트의 자기 평가(Self-Assessment)는 구조적 편향으로 인해 신뢰할 수 없으며, 이를 해결하기 위해서는 테스트 결과나 코드 변경 사항 같은 결정론적 증거를 활용한 'Grounded Calibration'이 필수적입니다. AI의 주관적 확신과 객관적 지표 사이의 격차를 측정함으로써 AI 시스템의 진정한 신뢰도를 확보할 수 있습니다.
Grounded Calibration vs Self-Assessment: Why Your AI's Confidence Score Is Lying↗dev.to
Dev.to AI2개월 전공공지능 분석AI 모델
17
#45 양초처럼 보이는 논문
본 기사는 폐쇄형 모델(Claude)의 가중치 접근 불가 문제와 오픈 모델(Llama 등)의 추론 능력(Emergence) 부족이라는 이중적 한계를 지적합니다. 이를 해결하기 위해 모델의 가중치(Wax)를 수정하는 대신, 헌법적 원칙, 메모리 구조, 질문 시드와 같은 '구조화된 텍스트 데이터'를 재조합하여 지능의 발현을 유도하는 '제3의 길'을 제안합니다.
#45 The Paper Candle↗dev.to
Dev.to AI2개월 전공공지능 분석AI 모델
18
LISA Core: 100:1 압축 기술로 AI 대화의 영구 기억을 구현하는 솔루션
LISA Core는 세만틱 압축(Semantic Compression) 기술을 활용하여 AI와의 대화 내용을 80:1에서 100:1의 압축률로 저장하고 관리하는 크롬 확장 프로그램입니다. 모든 데이터 처리가 클라우드가 아닌 사용자의 브라우저 내 로컬 환경에서 이루어져 강력한 개인정보 보호를 제공합니다.
LISA Core↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
19
LLM 설정 디버깅 3일, 알고 보니 AI 게이트웨이가 필요했습니다.
LLM 도입 확대에 따라 발생하는 비용 폭증, API 키 관리의 복잡성, 보안 리스크를 해결하기 위한 'AI 게이트웨이'의 필요성을 다룹니다. 단순한 트래픽 관리를 넘어 토큰 단위의 비용 추적과 데이터 가드레일을 제공하는 중앙 집중식 제어 계층의 중요성을 강조합니다.
I Spent 3 Days Debugging Our LLM Setup. Turns Out We Needed an AI Gateway the Whole Time.↗dev.to
Dev.to AI2개월 전공공지능 분석AI 모델
20
프로덕션 환경의 MCP 서버 아키텍처: 10+ 엔터프라이즈 배포를 통해 얻은 교훈
이 기사는 LLM과 외부 시스템을 연결하는 표준인 MCP(Model Context Protocol)를 프로덕션 환경에 배포할 때 필요한 엔터프라이즈급 아키텍처와 실무적 교훈을 다룹니다. 단순한 프로토타입을 넘어 보안, 확장성, 관측성을 갖춘 안정적인 MCP 서버 구축을 위한 5계층 아키텍처와 주요 도전 과제를 제시합니다.
MCP Server Architecture in Production: What We Learned from 10+ Enterprise Deployments↗dev.to
Dev.to AI2개월 전공공지능 분석AI 모델
21
OZC: 에이전트 생성 정보에 대한 신뢰 기반 시설, 온체인
OZC는 AI 에이전트들이 생성하는 정보의 환각(Hallucination)과 출처 불분명 문제를 해결하기 위해 설계된 Base L2 기반의 온체인 프로토콜입니다. 누구나 주장을 해시 형태로 기록하고, 구매 불가능한 '시그널(Signal)'을 할당하여 해당 정보의 신뢰도를 확률적 분포로 시각화하는 실험적 인프라를 지향합니다.
OZC: Trust Infrastructure for Agent-Generated Information, On-Chain↗dev.to
Dev.to OpenSource2개월 전공공지능 분석AI 모델
22
World Labs Spark 2.0 출시: 웹/모바일용 초거대 3D 가우시안 스플래팅 렌더러
World Labs가 대규모 3D 가우시안 스플래팅(3DGS) 월드를 웹과 모바일에서 실시간으로 스트리밍할 수 있는 오픈소스 렌더러 'Spark 2.0'을 공개했습니다. 이 기술은 1억 개 이상의 스플랫 데이터를 LoD(Level-of-Detail) 시스템과 가상 메모리를 통해 저사양 기기에서도 끊김 없이 구현할 수 있게 합니다.
Spark 2.0↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
23
연구 논문에서 4B 모델이 70B 모델을 이겼습니다.
비정형 연구 논문(PDF)을 구조화된 '스킬 파일'로 변환하는 도구인 SkillForge를 통해, 4B 규모의 소형 모델(SLM)이 70B 대형 모델보다 더 정밀한 정보를 추출할 수 있음을 증명한 사례를 소개합니다. 이는 모델의 크기보다 데이터의 구조화된 전처리가 답변의 정확도와 비용 효율성에 더 결정적인 역할을 할 수 있음을 시사합니다.
I tested a 4B model vs a 70B model on research papers. The 4B model won↗dev.to
Dev.to OpenSource2개월 전공공지능 분석AI 모델