Hacker News
원문 사이트 ↗Hacker News는 Y Combinator가 운영하는 글로벌 테크 커뮤니티로, 매일 수백 개의 스타트업·엔지니어링·연구 글이 업보팅으로 큐레이션됩니다. 실리콘밸리 창업자·시니어 개발자가 가장 빠르게 흡수하는 정보 채널로, 스타트업스쿨은 상위 인사이트만 한국어 분석과 함께 큐레이션합니다.
Hacker News 주요 토픽
Hacker News 관련 글 — 66 페이지
- 0
Claude의 생각 텍스트 변환: 자연어 오토인코더 활용
앤스로픽(Anthropic)이 AI 모델의 내부 연산 데이터인 '활성화(activations)'를 사람이 읽을 수 있는 자연어로 변환하는 '자연어 오토인코더(NLA)' 기술을 공개했습니다. 이 기술은 블랙박스 상태인 LLM의 내부 사고 과정을 텍스트로 추출하여, 모델의 숨겨진 의도나 안전성 문제를 직관적으로 파악할 수 있게 해줍니다.
Natural Language Autoencoders: Turning Claude's Thoughts into Text↗hacker-news.firebaseio.com
- 10
Show HN: Agent-skills-eval – 에이전트 기술이 출력 개선에 기여하는지 테스트하기
agent-skills-eval은 Anthropic의 Agent Skills 표준을 사용하여 에이전트의 특정 기술(SKILL.md)이 모델의 성능을 실제로 개선하는지 정량적으로 검증하는 테스트 프레임워크입니다. 스킬이 적용된 경우와 적용되지 않은 기본 상태(baseline)를 비교하여, 에이전트의 성능 향상을 데이터와 리포트로 입증할 수 있게 해줍니다.
Show HN: Agent-skills-eval – Test whether Agent Skills improve outputs↗hacker-news.firebaseio.com
- 13
ProgramBench: 언어 모델, 프로그램 코딩 없이 처음부터 재구축할 수 있을까?
ProgramBench는 LLM이 단순한 코드 수정을 넘어, 문서와 실행 결과만을 바탕으로 전체 소프트웨어 프로젝트를 처음부터 재구체화할 수 있는지 측정하는 새로운 벤치마크입니다. 실험 결과, 현재의 최상위 모델들도 복잡한 소프트웨어를 완벽히 구현하는 데 실패했으며, 인간의 코드와 달리 모듈화되지 않은 단일 파일 형태의 구현을 선호하는 한계를 보였습니다.
ProgramBench: Can Language Models Rebuild Programs from Scratch?↗hacker-news.firebaseio.com
- 19
교란-MARS: 인간의 시각으로 마우스 실험 분석
Noetik은 마우스 실험 데이터를 인간의 생물학적 관점에서 재해석할 수 있는 'Perturb-MARS' 기술을 공개했습니다. 이는 인간 암 조직으로만 학습된 파운데이션 모델(TARIO-2)을 활용해, 마우스 실험의 결과물을 인간의 유전자 발현 패턴으로 변환하여 신약 개발의 고질적인 문제인 종간 차이(Translation Gap)를 극복하려는 시도입니다.
Perturb-MARS: Reading mouse experiments through a human lens↗hacker-news.firebaseio.com



















