스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 04. 15. 오전 11:56 KST·총 24건

AI 모델 관련 글 — 74 페이지

0
Reka Edge: Physical AI 시대를 여는 7B 초고효율 VLM 분석
Reka Edge는 Physical AI 구현을 위해 설계된 7B 규모의 고효율 Vision Language Model(VLM)입니다. ConvNeXt V2 인코더를 통해 이미지 처리 토큰 사용량을 3배 절감하며, 초저지연 성능을 통해 실시간 영상 분석 및 객체 탐지를 가능하게 합니다.
Reka Edge↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
1
Fathom 3.0 출시: 회의록을 넘어 AI 지식 관리 플랫폼으로
Fathom 3.0은 단순한 AI 회의록 작성을 넘어, 봇 없이도 회의를 캡처하고 Claude 및 ChatGPT와 연동하여 회의 데이터를 지식 자산으로 변환하는 지능형 미팅 플랫폼으로 진화했습니다. 계정 전체에 걸친 AI 검색과 실시간 요약 기능을 통해 회의의 가치를 극대화하는 데 집중하고 있습니다.
Fathom 3.0↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
2
TwelveLabs의 페가수스 1.5
TwelveLabs가 비디오를 구조화된 타임스탬프 메타데이터로 변환하는 'Pegasus 1.5'를 출시했습니다. 사용자가 정의한 스키마에 따라 최대 2시간 분량의 영상을 쿼리 가능한 데이터 자산으로 변환하며, 이미지 기반의 멀티모달 검색 기능도 제공합니다.
Pegasus 1.5 by TwelveLabs↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
3
이론에서 증거로: 대규모 데이터 품질 검증을 위한 Shannon Entropy의 유효성 확인
이 기사는 대규모 데이터 품질 검증을 위해 Shannon Entropy(샤논 엔트로피)를 활용하는 방법론이 기존의 규칙 기반(Rule-based) 또는 통계적(KS-test) 방식보다 월등히 효과적임을 실험으로 증명합니다. 약 660만 건의 데이터를 대상으로 한 실험 결과, 엔트로피 기반 방식은 데이터 드리프트 탐지에서 오탐률 0%를 기록했으며, 기존 방식보다 최대 2.12배 빠른 처리 속도를 보여주었습니다.
From Theory to Evidence: Validating Shannon Entropy for Data Quality at Scale↗dev.to
Dev.to OpenSource2개월 전공공지능 분석AI 모델
4
Google, Chrome에 "Skills" 도입해 Gemini 프롬프트 즉시 재사용 가능하게 합니다
구글 크롬이 Gemini 프롬프통을 저장하고 클릭 한 번으로 즉시 실행할 수 있는 'Skills' 기능을 도입합니다. 이 기능은 반복적인 브라우징 작업을 자동화하여 사용자가 별도의 프롬프트 입력 없이도 웹 페이지 요약, 데이터 비교 등의 AI 작업을 효율적으로 수행할 수 있게 돕습니다.
Google introduces "Skills" in Chrome to make Gemini prompts instantly reusable↗arstechnica.com
Ars Technica2개월 전공공지능 분석AI 모델
5
Google, Chrome에 AI 기능 추가… 즐겨 사용하는 워크플로우 저장 지원
구글이 크롬 브라우저에 사용자가 자주 사용하는 AI 프롬프트를 저장하고 재사용할 수 있는 'Skills' 기능을 도입합니다. 이 기능은 Gemini AI와 통합되어 웹 페이지의 정보를 요약하거나 특정 작업을 자동화하는 등 개인화된 AI 워크플로우를 브라우저 내에서 즉시 실행할 수 있게 돕습니다.
Google adds AI Skills to Chrome to help you save favorite workflows↗techcrunch.com
TechCrunch2개월 전공공지능 분석AI 모델
6
다게노 AI
Dageno AI는 7개 이상의 주요 LLM(대규모 언어 모델)에서 브랜드의 노출도를 추적하고 최적화하는 GEO(Generative Engine Optimization, 생성형 엔진 최적화) 플랫폼입니다. 웹사이트, 트래픽, 소셜 미디어 등 다양한 데이터를 분석하여 AI 답변 내 브랜드 가시성 격차를 찾아내고, 에이전트 기반의 자동화된 워크플로우를 통해 이를 개선하는 솔루션을 제공합니다.
Dageno AI↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
7
비인간 ID 보호: 자동 해지, OAuth, 그리고 범위 기반 권한 부여
Cloudflare가 AI 에이전트 및 자동화 도구와 같은 '비인간 ID(Non-human identities)'를 보호하기 위한 새로운 보안 기능을 발표했습니다. GitHub와의 파트너십을 통한 토큰 자동 해지, OAuth 가시성 확보, 그리고 세분화된 권한 부여(RBAC)를 통해 AI 시대의 새로운 보안 위협에 대응합니다.
Securing non-human identities: automated revocation, OAuth, and scoped permissions↗blog.cloudflare.com
Cloudflare Blog2개월 전공공지능 분석AI 모델
8
MCP 도입 확장을 위한 레퍼런스 아키텍처: 더 간단하고 안전하며 저렴한 엔터프라이즈 MCP 배포
Cloudflare는 기업 내 AI 에이전트 워크플로우 확산을 위해 MCP(Model Context Protocol)를 안전하고 저렴하게 배포할 수 있는 레퍼런스 아키텍처를 공개했습니다. 로컬 MCP 서버의 보안 취약점을 해결하기 위해 중앙 집중형 원격 MCP 서버 구조를 채택하고, 인증 및 비용 관리 기능을 통합하여 엔터프라이즈급 AI 거버넌스를 구축하는 전략을 제시합니다.
Scaling MCP adoption: Our reference architecture for simpler, safer and cheaper enterprise deployments of MCP↗blog.cloudflare.com
Cloudflare Blog2개월 전공공지능 분석AI 모델
9
긱플레어 스크래핑 API v2
긱플레어(Geekflare)가 AI 에이전트와 RAG(검색 증강 생성) 환경에 최적화된 '스크래핑 API v2'를 출시했습니다. 이번 업데이트는 웹 데이터에서 불필요한 요소를 제거한 특화된 출력 형식을 제공하여, LLM 토큰 비용을 최대 85%까지 절감하는 것을 목표로 합니다.
Geekflare Scraping API v2↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
10
Portt: AI 기반의 API 검색 및 관리 플랫폼 출시
Portt는 단순한 얼굴 교체나 필터 적용을 넘어, 사진 속의 건축물, 패션, 질감 등 장면 전체를 특정 시대로 재구성하는 AI 기반 사진 편집 플랫폼입니다. 사용자는 기원전 3000년부터 서기 2050년까지 원하는 시대를 선택하여 사진을 역사적 또는 미래적 맥락으로 완전히 탈바꿈시킬 수 있습니다.
Portt↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
11
Claude, 비행기 조종 가능할까?
Claude가 X-Plane 12 시뮬레이터를 활용해 직접 비행기를 조종하며 물리적 환경과 상호작용하는 실험을 진행했습니다. 비행 중 발생하는 데이터 지연과 제어 로직의 부재로 인해 추락을 경험했으나, AI가 스스로 코드를 수정하며 문제를 해결하려는 과정은 AI 에이전트의 자율적 문제 해결 능력을 보여주는 중요한 사례입니다.
Can Claude Fly a Plane?↗so.long.thanks.fish
Hacker News2개월 전공공지능 분석AI 모델
12
내성적 확산 언어 모델
I-DLM(Introspective Diffusion Language Model)은 기존 확산 언적 모델(DLM)의 고질적인 문제인 품질 저하를 '내성적 일관성(Introspective Consistency)' 확보를 통해 해결한 혁신적인 모델입니다. 이를 통해 기존 AR(Autoregressive) 모델 수준의 성능을 유지하면서도, 고동시성 환경에서 추론 처리량(Throughput)을 최대 4.1배까지 끌어올리는 데 성공했습니다.
Introspective Diffusion Language Models↗introspective-diffusion.github.io
Hacker News2개월 전공공지능 분석AI 모델
13
MCP 대규모 환경에서의 활용: 접근 제어, 비용 관리, 92% 절감된 토큰 비용
MCP(Model Context Protocol) 도입 시 도구(Tool) 수가 늘어남에 따라 발생하는 토큰 비용 폭증과 보안 문제를 해결하기 위한 Bifrost의 'Code Mode' 기술을 소개합니다. 필요한 도구 정보만 온디맨드로 로드하는 레이지 로딩(Lazy Loading) 방식을 통해, 500개 이상의 도구 환경에서도 토큰 비용을 최대 92%까지 절감할 수 있습니다.
MCP at Scale: Access Control, Cost Governance, and 92% Lower Token Costs↗dev.to
Dev.to AI2개월 전공공지능 분석AI 모델
14
Llama.cpp의 속도가 알려주는 온프레미스 LLM 준비 상태
llama.cpp가 실험적 도구를 넘어 상용 수준의 온프레미스 LLM 구축을 가능하게 할 만큼 기술적으로 성숙해졌음을 알리며, 이제 핵심 과제는 기술이 아닌 조직의 운영 역량과 인프라 확보 능력에 있다고 강조합니다.
What llama.cpp's Pace Tells You About On-Prem LLM Readiness↗dev.to
Dev.to AI2개월 전공공지능 분석AI 모델
15
사티아마크: 실시간 콘텐츠 검증 시스템 설계
SatyaMark는 딥페이크와 가짜뉴스의 확산을 방지하기 위해 설계된 오픈소스 실시간 AI 콘텐츠 검증 서비스입니다. 개발자가 가벼운 SDK를 통해 자신의 플랫폼에 콘텐츠의 진위 여부를 나타내는 '신뢰 마크'를 손쉽게 통합할 수 있는 기술적 구조를 제안합니다.
SatyaMark: Designing a Real-Time Content Verification System↗dev.to
Dev.to WebDev2개월 전공공지능 분석AI 모델
16
2025년, 당신의 AI 스택에 게이트웨이 레이어가 필요한 이유
202나년 AI 서비스 운영의 핵심은 모델 자체보다 모델 주변의 복잡한 '플러밍(plumbing)'을 관리하는 것입니다. AI 게이트웨이는 여러 LLM 제공업체를 단일 인터페이스로 통합하여 장애 대응, 비용 추적, 사용량 제어를 자동화하는 필수적인 아키텍처 레이어입니다.
Why Your AI Stack Needs a Gateway Layer in 2025↗dev.to
Dev.to WebDev2개월 전공공지능 분석AI 모델
17
AI 제공업체 하드코딩은 이제 그만: 통합 AI 게이트웨이가 모든 것을 바꾼 이유
LLM 제공업체를 직접 하드코딩하는 방식의 위험성을 지적하며, 서비스 안정성, 비용 최적화, 관측 가능성을 확보하기 위한 '통합 AI 게이트웨이'의 필요성을 강조합니다. 게이트웨이를 통해 모델 라우팅, 자동 페일오버, 로드 밸런싱을 구현함으로써 견고한 AI 인프라를 구축할 수 있습니다.
Stop Hardcoding AI Providers: Why a Unified AI Gateway Changes Everything↗dev.to
Dev.to WebDev2개월 전공공지능 분석AI 모델
18
Show HN: Mcptube – Karpathy의 LLM 위키 아이디어를 유튜브 영상에 적용
mcptube-vision은 유튜브 영상을 단순한 검색 대상이 아닌, 지속적으로 업데이트되는 '지식 위키(Wiki)'로 변환하는 엔진입니다. Andrej Karpathy의 LLM Wiki 아이디어를 바탕으로, 텍스트(자막)와 시각 정보(프레임 분석)를 결합하여 영상 속 지식을 구조화하고 새로운 영상이 추가될 때마다 기존 지식과 연결하여 지식의 복리 효과를 창출합니다.
Show HN: Mcptube – Karpathy's LLM Wiki idea applied to YouTube videos↗github.com
Hacker News Show2개월 전공공지능 분석AI 모델
19
N-Day-Bench: LLM이 실제 코드베이스에서 실제 취약점을 찾을 수 있을까?
N-Day-Bench는 LLM이 학습 데이터 컷오프(Knowledge Cut-off) 이후에 공개된 실제 보안 취약점(N-Day)을 찾아낼 수 있는 능력을 측정하는 새로운 벤치마크입니다. 이 벤치마크는 모델의 단순한 지식 암기가 아닌, 실제 코드베이스에서 새로운 보안 위협을 발견하는 '취약점 탐지(Vulnerability Discovery)' 역량을 정밀하게 평가합니다.
N-Day-Bench – Can LLMs find real vulnerabilities in real codebases?↗ndaybench.winfunc.com
Hacker News2개월 전공공지능 분석AI 모델
20
PR 미리보기, 프로덕션 데이터베이스와 통신 중
Cloudflare Workers의 프리뷰 배포(PR)가 기본 설정 시 프로덕션 데이터베이스(D1)와 직접 연결되어 데이터 오염을 일으킬 수 있는 위험을 경고합니다. 이를 방지하기 위해 Wrangler Environments를 활용하여 프로덕션과 격리된 스테이징 환경을 구축하는 구체적인 기술적 해결책을 제시합니다.
Your PR Preview Is Talking to Your Production Database↗dev.to
Dev.to WebDev2개월 전공공지능 분석AI 모델
21
contextzip gain으로 절약하는 모든 토큰 추적하기
ContextZip은 AI 코딩 워크플로우에서 발생하는 불필요한 데이터를 제거하여 토큰 사용량을 추적하고 시각화하는 도구입니다. CLI 명령 실행 시 발생하는 노이즈를 제거함으로써 LLM API 비용을 실질적으로 절감하고, 절약된 토큰 양을 실시간으로 확인할 수 있게 해줍니다.
Track Every Token You Save With contextzip gain↗dev.to
Dev.to OpenSource2개월 전공공지능 분석AI 모델
22
Send/links: AI 모델 개발, API 공개로 GPU 활용도 높인다
send/links는 사용자가 브라우저에서 링크를 간편하게 저장, 정리, 검색할 수 있도록 돕는 크롬 확장 프로그램입니다. 별도의 수동 태깅이나 폴더 관리 없이 AI를 통해 자동으로 제목과 카테고리를 분류하여 정보 과부하 문제를 해결합니다.
send/links↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델
23
Cenote: AI 모델 개발을 위한 새로운 API 플랫폼
Cenote는 장바구니 이탈 고객이나 이탈한 환자 등 구매 의도가 높은 잠재 고객을 실시간으로 찾아내어 텍스트나 음성으로 응대하는 AI 영업 에이전트 플랫폼입니다. 별도의 엔지니어링 작업 없이 일주일 이내에 도입이 가능하며, D2C 브랜드가 이미 지불한 마케팅 비용의 효율을 극대화하여 매출 회복을 돕습니다.
Cenote↗producthunt.com
Product Hunt2개월 전공공지능 분석AI 모델