스텝 3.7 플래시

(producthunt.com)

Product Hunt2026년 5월 29일AI 코딩

Stepfun이 공개한 Step 3.7 Flash는 시각, 코딩, 도구 사용 능력을 갖춘 11B 규모의 오픈 웨이트 모델로, 초고속 추론 성능을 통해 실시간 에이전트 구현을 위한 새로운 표준을 제시합니다.

이 글의 핵심 포인트

1Apache 2.0 라이선스의 오픈 웨이트 모델로 자유로운 상업적 활용 가능
2약 11B(110억 개)의 활성 파라미터를 가진 고효율 모델 규모
3초당 최대 400 토큰(TPS)의 압도적인 추론 속도 구현
4256K의 대규모 컨텍스트 창 지원으로 긴 문맥 및 대량 데이터 처리 가능
5시각(Vision), 코딩, 검색, 도구 사용(Tool use) 기능이 통합된 멀티모달 에이전트 특화

이 글에 대한 공공지능 분석

왜 중요한가?

11B 규모의 경량 모델이 시각과 도구 사용 능력을 갖추고 초고급 추론 속도(400 TPS)를 제공한다는 점은, 사용자가 지연 시간을 거의 느끼지 못하는 '실시간 AI 에이전트' 서비스의 상용화 가능성을 획기적으로 높이기 때문입니다.

어떤 배경과 맥락이 있나?

현재 AI 산업은 거대 모델(LLM)의 성능 경쟁을 넘어, 특정 작업에 특화되어 도구를 자유자재로 사용하는 '에이전틱 워크플로우(Agentic Workflow)'로 패러다임이 전환되고 있으며, 이에 따라 효율적인 오픈 웨이트 모델의 수요가 급증하고 있습니다.

업계에 어떤 영향을 주나?

저비용·고효율의 오픈 웨이트 모델 출현은 기업들이 폐쇄형 API에 의존하지 않고도 자체적인 에이전트 인프라를 구축할 수 있게 하여, 서비스 레이어에서의 혁신적인 에이전트 애플리케이션 경쟁을 촉발할 것입니다.

한국 시장에 어떤 시사점이 있나?

한국의 AI 스타트업들은 고비용의 글로벌 모델 대신, 이러한 고성능 오픈 모델을 기반으로 특정 산업 도메인(금융, 제조, 법률 등)에 특화된 초고속·저비용 에이전트 서비스를 빠르게 구축하여 시장 선점 기회를 가질 수 있습니다.

이 글에 대한 큐레이터 의견

Step 3.7 Flash의 등장은 AI 모델의 경쟁력이 단순히 '파라미터 규모'에 있는 것이 아니라, '실행 속도'와 '도구 활용 능력'으로 이동하고 있음을 극명하게 보여줍니다. 초당 400 토큰이라는 압도적인 속도는 단순한 텍스트 생성을 넘어, 실시간으로 화면을 보고 코드를 실행하며 사용자와 상호작용하는 진정한 의미의 '액션 에이전트(Action Agent)' 시대를 앞당기는 트리거가 될 것입니다.

스타트업 창업자들은 이제 모델 자체를 개발하는 데 리소스를 쏟기보다, 이처럼 강력한 오픈 웨이트 모델을 어떻게 비즈니스 로직 및 외부 API와 결합하여 '완결성 있는 에이전트 경험'을 설계할 것인지에 집중해야 합니다. 특히 256K의 긴 컨텍스트를 활용해 방대한 데이터를 분석하거나 복잡한 워크플로우를 자동화하는 버티컬 에이전트 시장에서 강력한 기회가 존재합니다.

원문 보기 →