AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 15 페이지
- 2
nvoc: 멀티 GPU 지원, 스크립팅 기능 추가 및 AI 활용 성능 개선
nvoc는 Linux 환경에서 NVIDIA GPU의 클럭과 전압을 조절하는 CLI 도구로, 이번 업데이트를 통해 멀티 GPU 지원 및 UUID 기반의 안정적인 장치 식별 기능을 추가했습니다. 또한 JSON 출력 지원과 systemd 연동을 통해 AI 워크로드 최적화를 위한 스크립트 자동화가 훨씬 용이해졌습니다.
nvoc: linux overclocking gains multi GPU support, scripting, and is improved for ai use↗dev.to
- 8
SuperCompress가 이제 PyPI에 출시되었습니다! 단 한 줄로 supercompress를 설치하세요 (pip install supercompress)
SuperCompress는 LLM에 컨텍스트를 전달하기 전, 관련성이 높은 문장만을 선별하여 토큰 사용량을 최대 65%까지 줄여주는 초경량 CPU 기반 정책입니다. GPU 없이도 약 60ms 내외의 매우 낮은 지연 시간으로 작동하며, 답변의 정확도를 유지하면서 비용 효율성을 극대화할 수 있는 오픈소스 라이브러리입니다.
SuperCompress is now on PyPI! pip install supercompress in 1 line↗dev.to
- 12
LLM 출력 품질이 여러 번 압축될 때 얼마나 저하되는지 측정해 본 적 있나요?
컨텍스트 압축이 반복될 때 LLM의 성능 저하 양상이 단순 선형적이지 않고 특정 지점에서 일시적 상승 후 급락하는 현상을 관찰했습니다. 현재 RULER나 Context Rot 같은 기존 벤치마크는 정적 입력 길이에만 집중하고 있어, 압축 반복에 따른 '압축 지속성(compaction persistence)'을 측정할 새로운 기준이 필요합니다.
Has Anyone Measured How LLM Output Quality Degrades Across Multiple Compactions?↗dev.to
- 13
AI 런타임 보안: 프롬프트 인젝션 및 위험한 결과 실시간 탐지
AI 서비스가 실제 운영되는 환경에서의 보안인 '런타임 보안'은 프롬프트 인젝션과 같은 동적인 위협을 막는 핵심 기술입니다. 직접적인 공격뿐만 아니라 외부 데이터를 이용한 간접적 공격에 대응하기 위해 의미론적 분석, 행동 이상 탐지, 판사 모델(Model-as-Judge) 등을 활용한 다층적 방어 체계가 필요합니다.
AI Runtime Security: Detecting Prompt Injection and Unsafe Outputs in Real Time↗dev.to
- 14
OpenAI, 정부 요청에 따라 GPT-5.6 제한적 출시 후 “관례가 되어서는 안 된다”고 밝혀
OpenAI가 미국 정부의 압박으로 인해 GPT-5.6 시리즈(Sol, Terra, Luna)를 일부 파트너에게만 선공개하며, 향후 출시 프로세스에 대한 정부와의 협의를 진행 중입니다. 이번 모델은 강력한 에이전트 기능과 보안 강화를 특징으로 하지만, 정부의 사전 검토 요구로 인해 기술 접근성이 제한될 우려가 있습니다.
OpenAI limits GPT-5.6 rollout after government request, says restrictions shouldn’t be the norm↗techcrunch.com
- 18
OpenAI, GPT-5.6 Sol, Terra 및 Luna 모델 공개…현재는 제한된 프리뷰 파트너만 접근 가능, 미국 정부 발표에 따르면
OpenAI가 복잡한 코딩용 Sol, 비즈니스 업무용 Terra, 일상 자동화용 Luna로 구성된 GPT-5.6 모델 패밀리의 제한적 프리뷰를 발표했습니다. 이번 업데이트는 특정 작업에 최적화된 모델 분화를 통해 성능과 효율성을 동시에 극대화하는 데 초점을 맞추고 있습니다.
OpenAI unveils GPT-5.6 Sol, Terra and Luna models — but only accessible to limited preview partners for now, per US Gov↗venturebeat.com

















