스타트업스쿨StartupSchool

AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

최신 업데이트 2026. 04. 28. 오전 05:50 KST·총 24건

AI 모델 관련 글 — 59 페이지

0
DeepSeek V4 Pro 출시 – AI 에이전트를 위한 변경 사항 확인
DeepSeek V4 Pro가 출시되어 1MB 토큰의 대규모 컨텍스트와 압도적인 가성비를 제공합니다. 특히 'Think/Non-Think' 듀얼 모드를 통해 AI 에이전트의 복잡한 추론과 빠른 응답을 동시에 지원하며, 기존 Claude나 GPT-4o 대비 매우 저렴한 비용을 자랑합니다.
DeepSeek V4 Pro Just Dropped — Here's What Changed for AI Agents↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
1
OpenAI SDK를 친구의 게이밍 PC에 연결했더니, 그냥 잘 작동했어.
AgentFM은 OpenAI SDK와 100% 호환되는 P2P(Peer-to-Peer) AI 컴퓨팅 그리드로, 중앙 집중형 클라우드 없이 전 세계의 유휴 GPU/CPU 자원을 연결합니다. 사용자는 기존 코드 수정 없이 친구의 게이밍 PC와 같은 분산된 노드를 통해 Llama 3.2와 같은 모델을 저비용으로 실행할 수 있습니다.
I pointed the OpenAI SDK at my friend's gaming PC. It just worked.↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
2
색상 이미지 분할에 따른 L*A*B* 및 HSV 색 공간 성능 비교
본 기사는 이미지 분할(Segmentation) 작업에서 L*A*B*와 HSV 색 공간이 갖는 성능 차이를 비교 분석합니다. 각 색 공간의 특성이 객체 분할의 정확도와 조명 변화에 대한 강건성에 미치는 영향을 다룹니다.
Comparing the Performance of L*A*B* and HSV Color Spaces with Respect to ColorImage Segmentation↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
3
티엔 AI: Qwen2.5 기반의 자체 진화형 AI 시스템
티엔 AI(Tian AI)는 Qwen2.5-1.5B 모델을 기반으로 설계된 오픈소스 자가 진화형 AI 시스템입니다. 이 시스템은 단순한 질의응답을 넘어, AST(추상 구문 트리) 분석을 통해 스스로의 소스 코드를 수정하고 성능을 개선하는 혁신적인 자가 진화 메커니즘을 갖추고 있습니다.
Tian AI: The Self-Evolving AI System Powered by Qwen2.5↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
4
티안 AI: 완전 오프라인의 자가 진화 AI 시스템, Qwen2.5 기반
Tian AI는 Qwen2.5-1.5B 모델을 기반으로 한 완전 오프라인 자가 진화 AI 시스템입니다. 단순한 질의응답을 넘어 로컬 지식베이스를 활용하고, 스스로 코드를 수정하며 진화하는 기능을 갖추어 모바일 환경에서도 보안과 성능을 동시에 잡은 혁신적인 프레임워크입니다.
Tian AI：完全离线的自我进化AI系统，基于Qwen2.5↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
5
OpenAI, Microsoft와의 독점 파트너십 종료
OpenAI와 Microsoft의 독점적 파트너십이 종료되며, OpenAI가 Azure 외에도 AWS 등 다양한 클라우드 제공업체를 통해 자사 모델을 서비스할 수 있게 되었습니다. Microsoft는 여전히 주요 파트너이자 IP 라이선스 보유자로 남지만, OpenAI는 기업 고객 확보를 위해 멀티 클라우드 전략을 본격화합니다.
OpenAI ends its exclusive partnership with Microsoft↗arstechnica.com
Ars Technica1개월 전공공지능 분석AI 모델
6
사이오닉에이아이, 한국외대와 손잡고 ‘동남아 특화 AI 모델’ 공동 개발 나선다
사이오닉에이아이가 한국외국어대학교와 업무협약(MOU)을 체결하고, 동남아시아 시장에 최적화된 '현지화 AI 모델' 개발에 나섭니다. 이번 협력은 한국외대의 특수외국어 데이터와 사이오닉에이아이의 생성형 AI 기술을 결합하여, 언어와 문화적 맥락이 중요한 동남아 시장을 공략하기 위한 전략적 행보입니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어1개월 전공공지능 분석AI 모델
7
AISA AI 기술 평가
AISA는 세계 최초의 대화형 AI 숙련도 및 노하우 평가 플랫폼으로, 5가지 차원에서 AI 활용 능력을 측정합니다. 출시 직후 220건 이상의 평가를 기록하며 초기 성과를 거두었으며, 측정 결과에 따라 개인화된 성장 계획과 마이크로 러닝 경험을 제공합니다.
AISA AI Skills Test↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
8
변호사 업무에 법률 인사이트 전환을 구현하는 방법
법률 전문가가 업무 효율을 극대화하기 위해 기존 리서치 워크플로우를 진단하고, 최신 기술을 체계적으로 도입하여 '법률 인사이트 전환'을 이루는 5단계 방법론을 제시합니다. 단순한 도구 도입을 넘어, 업무 프로세스의 재설계와 단계적 적용을 통해 업무 시간을 최대 60%까지 절감할 수 있는 전략을 다룹니다.
How to Implement Legal Insight Transformation in Your Practice↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
9
정적 환경의 공동 저자
이 글은 AI를 단순한 기능적 도구가 아닌, 인간의 창의적 사고를 변화시키는 '공동 저자'이자 '환경'으로 재정의합니다. AI의 비대칭적 특성을 인정하면서도, AI가 제공하는 예상치 못한 자극이 인간의 창작 과정을 어떻게 재구성하는지에 주목합니다.
Co-authors in the static↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
10
대한민국과의 파트너십 발표
구글 딥마인드가 한국과 선도적인 AI 모델을 활용한 과학적 혁신 가속화를 위해 파트너십을 체결했습니다. 이번 협력은 최첨단 AI 기술을 과학 연구 및 R&D 분야에 접목하여 기술적 돌파구를 마련하는 것을 목표로 합니다.
Announcing our partnership with the Republic of Korea↗deepmind.google
DeepMind Blog1개월 전공공지능 분석AI 모델
11
오디세이-2 맥
AI 연구소 Odyssey가 실시간 상호작용이 가능한 차세대 월드 모델 'Odyssey-2 Max'를 공개했습니다. 이 모델은 자기회귀적 차기 상태 예측(autoregressive next-state prediction) 기술을 통해 물리적 정확도와 장기적 안정성을 높인 인터랙티브 비디오 경험을 제공합니다.
Odyssey-2 Max↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
12
Show HN: Mdlens – 마크다운 중심 저장소에서 토큰 사용량 감소 및 검색 성능 향상
Mdlens는 AI 에이전트가 마크다운(Markdown) 문서를 검색할 때 토큰 사용량을 줄이고 정확도를 높여주는 CLI 도구입니다. 기존의 비효율적인 파일 읽기 방식 대신, 필요한 정보만 정밀하게 추출한 '증거 팩(evidence pack)'을 제공하여 에이전트의 운영 비용을 획기적으로 절감합니다.
Show HN: Mdlens – Reduce token spend and boost retrieval on Markdown-heavy repos↗github.com
Hacker News Show1개월 전공공지능 분석AI 모델
13
TurboQuant: 원리부터 알아가는 여정
이 기사는 TurboQuant 기술의 근간이 되는 수학적 원리들을 설명하는 기술 프리뷰입니다. 고차원 벡터의 기하학적 특성, 중심한계정리(CLT), 그리고 측정 집중 현상(Measure Concentration)을 활용하여 데이터 양자화(Quantization) 시 발생하는 오차를 어떻게 효율적으로 관리하고 압축할 수 있는지 그 수학적 토대를 다룹니다.
TurboQuant: A First-Principles Walkthrough↗arkaung.github.io
Hacker News1개월 전공공지능 분석AI 모델
14
Claude Desktop, 써드파티 API 지원 시작 — 설정 방법은 다음과 같습니다
Anthropic의 Claude Desktop에 'Developer Mode'가 도입되어, 사용자가 월정액 구독 대신 개인 API 키나 서드파티 API 게이트웨이를 통해 Claude를 사용할 수 있게 되었습니다. 이를 통해 사용자는 토큰 단위 결제로 비용을 최적화하고, 하나의 엔드포인트로 Claude, GPT, Gemini 등 다양한 모델을 통합 관리할 수 있는 유연성을 얻게 됩니다.
Claude Desktop Now Supports Third-Party APIs — Here's How to Set It Up↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
15
티엔 AI: 당신의 개인 맞춤형, 스스로 진화하는 AI 엔진 — 3가지 실제 활용 사례
Tian AI는 클라우드 의존성 없이 로컬 하드웨어에서만 작동하는 프라이버시 중심의 AI 엔진입니다. 3단계 사고 파이프라인(Fast, CoT, Deep Reflection)을 통해 보안이 중요한 연구자, 개발자, 기업을 타겟으로 하며, 데이터 유출 위험을 원천 차단하는 로컬 실행 환경을 제공합니다.
Tian AI: Your Private, Self-Evolving AI Engine — 3 Real-World Use Cases↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
16
향후 전망 및 운영 모델
OpenClaw는 단순한 AI 데모를 넘어, 실제 운영 가능한 AI 에이전트 시스템을 구축하기 위한 체계적인 프레임워크를 제시합니다. Brain, Voice, Senses, Connection이라는 4단계 스택을 통해 모델의 성능뿐만 아니라 보안, 유지보수, 운영 프로세스의 중요성을 강조합니다.
Future Outlook & Operating Model↗dev.to
Dev.to DevOps1개월 전공공지능 분석AI 모델
17
파생 AI 모델 게시 시 라이선스 위반을 피하는 방법
AI 모델을 파인튜닝, 병합(Merge) 또는 Abliteration(거부 메커니즘 제거)하여 새로운 모델을 배포할 때, 원본 모델의 라이선스 의무 사항을 반드시 준수해야 한다는 경고를 담고 있습니다. 개발자들이 모델 가중치를 단순한 '데이터'로 오인하여 출처 표기나 라이선스 계승 의무를 놓치는 실수를 방지하기 위한 구체적인 체크리스트를 제시합니다.
How to Avoid License Violations When Publishing Derivative AI Models↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
18
LLM과 소규모 언어 모델: 기술 동향 이해하기
본 기사는 거대 언어 모델(LLM)과 소규모 언어 모델(SLM)의 구조적 차이와 특징을 비교 분석합니다. 방대한 데이터를 통한 범용적 능력을 갖춘 LLM과, 특정 작업에 최적화되어 효율성과 비용 효율성을 극대화한 SLM의 트레이드오프를 설명하며 상황에 맞는 모델 선택의 중요성을 강조합니다.
LLMs vs. Small Language Models: Understanding the Landscape↗dev.to
Dev.to DevOps1개월 전공공지능 분석AI 모델
19
2D 상담 넘었다…퍼펙트, AI 피부 분석으로 3D 뷰티 컨설팅 진화
퍼펙트 코퍼레이션이 3D 컨설팅 솔루션 기업 킨사이트와 협력하여 '루미트리' 플랫폼에 AI 피부 분석 API를 적용했습니다. 이번 협업은 기존 2D 이미지 중심의 상담을 3D 모델링과 AI 데이터가 결합된 정밀 상담 체계로 전환하며, 일부 고객사에서 상담 전환율을 50% 이상 끌어올리는 성과를 냈습니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어1개월 전공공지능 분석AI 모델
20
맥락이 전부다
AI의 진정한 가치는 모델의 지능 그 자체가 아니라, 사용자의 과거와 현재를 연결하는 '맥락(Context)'과 '메모리 아키텍처'에 있습니다. 단순한 모델 활용을 넘어, 데이터의 영속성을 확보하여 '나를 아는 AI'를 만드는 인프라 구축이 핵심 경쟁력입니다.
Context Is Everything↗dev.to
Dev.to OpenSource1개월 전공공지능 분석AI 모델
21
Show HN: WaveletLM – O(n log n) 스케일링을 가진 웨이블릿 기반, 어텐션 없는 모델
WaveletLM은 기존 트랜스포머의 어텐션 메커니즘을 제거하고 웨이블릿 변환(Wavelet Transform)을 도입하여 시퀀스 길이에 대해 O(n log n)의 효율적인 스케일링을 구현한 새로운 언어 모델 아키텍처입니다. 학습된 리프팅 웨이블릿 분해와 FWHT(Fast Walsh-Hadamard Transform)를 통해 긴 문맥을 매우 효율적으로 처리할 수 있는 가능성을 제시합니다.
Show HN: WaveletLM – wavelet-based, attention-free model with O(n log n) scaling↗github.com
Hacker News Show1개월 전공공지능 분석AI 모델
22
Show HN: 생물학적 감쇠를 활용한 AI 메모리 (52% 재현율)
YourMemory는 에빙하우스의 망각 곡선 원리를 활용하여 AI 에이전트에게 인간과 유사한 영구 기억력을 부여하는 새로운 메모리 레이어입니다. 중요한 정보는 유지하고 불필요한 정보는 자연스럽게 삭제하는 생물학적 감쇠 모델을 통해, 기존 솔루션 대비 2배 이상의 높은 정보 재현율(59%)을 달수 있습니다.
Show HN: AI memory with biological decay (52% recall)↗github.com
Hacker News Show1개월 전공공지능 분석AI 모델
23
부실한 복사본
최근 AI 기술의 발전으로 인해 기존의 성공적인 서비스를 무단으로 복제하여 가짜 리뷰와 스팸성 콘텐츠로 무장한 '부실한 복사본(Sloppy Copies)'이 급증하고 있습니다. 이는 단순한 기능 모방을 넘어, 봇을 이용한 자동화된 스크래핑과 소셜 미디어 조작을 통해 사용자 신뢰를 훼손하는 새로운 형태의 위협으로 부상하고 있습니다.
Sloppy Copies↗markround.com
Hacker News1개월 전공공지능 분석AI 모델