AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
최신 업데이트 ·총 24건
AI 모델 관련 글 — 60 페이지
- 1
미세 조정된 모델, 프롬프트 기반이 아니다: 오펜시브 보안에서 LLM 래퍼를 능가하는 이유
단순히 LLM API를 활용하는 '프롬프트 기반 래퍼' 방식은 보안 분야에서 환각, 프롬프트의 취약성, 학습 루프 부재라는 치명적 한계를 가집니다. 반면, 전문적인 공격 데이터를 통해 모델 가중치에 패턴을 내재화하고 지속적인 학습 루프를 구축한 '미세 조정(Fine-tuned) 모델'이 보안 성능의 핵심 경쟁력이 될 것입니다.
Trained, Not Prompted: Why Fine-Tuned Models Beat LLM Wrappers for Offensive Security↗dev.to
- 2
VEXT Specialist-7B: 7B 모델이 Frontier AI의 보안 벤치마크를 능가하는 방법
VEXT Specialist-7B는 특정 보안 도메인에 특화된 7B 파라미터 모델로, GPT-4o나 Claude Opus와 같은 거대 모델보다 침투 테스트 및 보안 벤치마크에서 압도적인 성능을 보여줍니다. 3단계 계층형 아키텍처와 고품질의 실제 보안 데이터를 활용하여 추론 비용을 95% 절감하면서도 보안 정확도를 극대화했습니다.
VEXT Specialist-7B: How a 7B Model Beats Frontier AI on Security Benchmarks↗dev.to
- 17
Show HN: GPT/Claude 인용 시 AI 가시성 모니터 - 사이트 언급 추적
이 기사는 ChatGPT, Claude, Perplexity 등 AI 검색 엔진에서의 웹사이트 노출 및 인용 여부를 추적할 수 있는 Python 기반의 오픈소스 툴킷 'AI Visibility Monitor'를 소개합니다. 별도의 유료 SaaS 없이 로컬 환경에서 실행 가능한 이 도구는 AI 시대의 새로운 마케팅 지표인 'AI 인용률'과 'AI 유입 트래픽'을 정밀하게 모니터링할 수 있게 해줍니다.
Show HN: AI Visibility Monitor – Track if your site gets cited by GPT/Claude↗github.com
- 19
더 많은 파라미터가 더 중요할까, 더 많은 컴퓨테이션이 더 중요할까? (2021)
본 기사는 딥러닝 모델의 성능을 결정하는 핵심 요소인 '파라미터 수'와 '연산량'을 분리하여 생각할 수 있는 새로운 방법론을 제시합니다. 해시 레이어(Hash Layers)를 통해 연산량 증가 없이 파라미터 규모를 키우는 방법과, 계단식 어텐션(Staircase Attention)을 통해 파라미터 수 증가 없이 연산량을 늘려 성능을 높이는 두 가지 혁신적인 접근법을 다룹니다.
Which one is more important: more parameters or more computation? (2021)↗parl.ai
- 21
Show HN: LLM이 광고 기반 웹 검색보다 모바일 에너지 소비량 5.4배 적음
본 기사는 AI의 에너지 소비를 '서버 측 연산'이 아닌 '사용자 전체 세션' 관점에서 재정의하며, LLM이 광고 기반 웹 검색보다 모바일 에너지 소비가 약 5.4배 적다는 연구 결과를 소개합니다. 이는 AI가 기존의 무거운 웹 생태계보다 훨씬 에너지 효율적인 정보 탐색 도구가 될 수 있음을 시사합니다.
Show HN: LLMs consume 5.4x less mobile energy than ad-supported web search↗dupr.at
- 23
Show HN: 에이전트가 관리하는 Karpathy 스타일 LLM 위키 (Markdown 및 Git)
WUPHF는 AI 에이전트들이 마치 실제 팀원처럼 협업하며 업무를 수행하는 'AI 에이전트 전용 협업 오피스'입니다. Git 기반의 Markdown 위키를 통해 에이전트 간 지식을 공유하며, PM, 개발자, 디자이너 등 각 역할에 특화된 에이전트들이 24시간 중단 없이 업무를 처리하고 결과물을 만들어냅니다.
Show HN: A Karpathy-style LLM wiki your agents maintain (Markdown and Git)↗github.com






![팁: 웹 요청은 헤르츠[Hertz]로 측정해서는 안 됩니다](https://startupschool.cc/og/tip-web-requests-should-not-be-measured-in-hz-hertz-2a5ef9.jpg)










