AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 59 페이지
- 12
Show HN: Mdlens – 마크다운 중심 저장소에서 토큰 사용량 감소 및 검색 성능 향상
Mdlens는 AI 에이전트가 마크다운(Markdown) 문서를 검색할 때 토큰 사용량을 줄이고 정확도를 높여주는 CLI 도구입니다. 기존의 비효율적인 파일 읽기 방식 대신, 필요한 정보만 정밀하게 추출한 '증거 팩(evidence pack)'을 제공하여 에이전트의 운영 비용을 획기적으로 절감합니다.
Show HN: Mdlens – Reduce token spend and boost retrieval on Markdown-heavy repos↗github.com
- 14
Claude Desktop, 써드파티 API 지원 시작 — 설정 방법은 다음과 같습니다
Anthropic의 Claude Desktop에 'Developer Mode'가 도입되어, 사용자가 월정액 구독 대신 개인 API 키나 서드파티 API 게이트웨이를 통해 Claude를 사용할 수 있게 되었습니다. 이를 통해 사용자는 토큰 단위 결제로 비용을 최적화하고, 하나의 엔드포인트로 Claude, GPT, Gemini 등 다양한 모델을 통합 관리할 수 있는 유연성을 얻게 됩니다.
Claude Desktop Now Supports Third-Party APIs — Here's How to Set It Up↗dev.to
- 17
파생 AI 모델 게시 시 라이선스 위반을 피하는 방법
AI 모델을 파인튜닝, 병합(Merge) 또는 Abliteration(거부 메커니즘 제거)하여 새로운 모델을 배포할 때, 원본 모델의 라이선스 의무 사항을 반드시 준수해야 한다는 경고를 담고 있습니다. 개발자들이 모델 가중치를 단순한 '데이터'로 오인하여 출처 표기나 라이선스 계승 의무를 놓치는 실수를 방지하기 위한 구체적인 체크리스트를 제시합니다.
How to Avoid License Violations When Publishing Derivative AI Models↗dev.to
- 21
Show HN: WaveletLM – O(n log n) 스케일링을 가진 웨이블릿 기반, 어텐션 없는 모델
WaveletLM은 기존 트랜스포머의 어텐션 메커니즘을 제거하고 웨이블릿 변환(Wavelet Transform)을 도입하여 시퀀스 길이에 대해 O(n log n)의 효율적인 스케일링을 구현한 새로운 언어 모델 아키텍처입니다. 학습된 리프팅 웨이블릿 분해와 FWHT(Fast Walsh-Hadamard Transform)를 통해 긴 문맥을 매우 효율적으로 처리할 수 있는 가능성을 제시합니다.
Show HN: WaveletLM – wavelet-based, attention-free model with O(n log n) scaling↗github.com



















