ZTE, 토큰 경제 활성화를 위한 최적의 TCO를 갖춘 AI 팩토리 구축

(theregister.com)

ZTE가 MWC 상하이 2026에서 발표한 OEX 아키텍처 기반 SuperPOD는 하드웨어와 소프트웨어의 통합 최적화를 통해 토큰 생성 효율을 극대화하고 AI 인프라 구축의 총소유비용(TCO)을 혁신적으로 낮추는 차세대 AI 팩토리 솔루션을 제시합니다.

이 글의 핵심 포인트

1OEX(Orthogonal Electrical eXchange) 아키텍처를 통한 미드플레인 프리 및 제로 케이블 설계 구현
2단일 랙 내 128개의 GPU 통합 지원 및 최대 16,000개 규모의 초거대 클러스터 확장 가능
3DPU 하드웨어 가속을 통한 AI 네이티브 KV 캐시 구현으로 데이터 전송 지연 최소화 및 70% 이상의 히트율 달성
4'Pre Integration' 모델 도입을 통해 제품 적응 및 전환 주기를 1년에서 6개월로 단축
5토큰 생성 효율(TPS) 극대화와 총소유비용(TCO) 절감을 통한 토큰 경제 활성화 지원

이 글에 대한 공공지능 분석

왜 중요한가?

AI 모델의 상용화 단계가 학습에서 추론으로 넘어가면서 '토큰당 비용(Cost per Token)'이 핵심 경쟁력이 되었기 때문입니다. ZTE의 솔루션은 인프라 효율을 극대화하여 AI 서비스의 경제적 지속 가능성을 결정짓는 기술적 돌파구를 제시합니다.

어떤 배경과 맥락이 있나?

대규모 언어 모델(LLM)의 확산으로 인해 막대한 컴퓨팅 자원과 전력 소모가 산업의 병목 현상으로 떠오르고 있습니다. 이에 따라 단순한 성능 향상을 넘어, 에너지 효율과 하드웨어 유연성을 동시에 확보하려는 아키텍처 혁신이 요구되는 시점입니다.

업계에 어떤 영향을 주나?

GPU 중심의 경직된 인프라 구조에서 벗어나 CPU와 스위치 칩을 독립적으로 최적화할 수 있는 '탈중앙화된 하드웨어 설계'가 확산될 것입니다. 이는 AI 서비스 제공업체들이 특정 벤더에 종속되지 않고 비용 효율적인 맞춤형 클러스터를 구축할 수 있는 환경을 조성합니다.

한국 시장에 어떤 시사점이 있나?

자체 LLM을 개발하거나 AI 서비스를 운영하는 국내 스타트업들에게는 인프라 비용 최적화가 생존 직결 문제입니다. ZTE와 같은 저비용·고효율 아키텍처의 등장은 하드웨어 종속성을 낮추고 서비스 경쟁력에 집중할 수 있는 새로운 기회를 제공할 것입니다.

이 글에 대한 큐레이터 의견

ZTE의 OEX 아키텍처는 AI 인프라를 단순한 서버 집합이 아닌, 유연하게 진화 가능한 '플랫폼'으로 재정의하려는 시도로 보입니다. 특히 미드플레인 프리(midplane-free)와 제로 케이블 설계를 통해 물리적 복잡성을 줄이고 확장성을 확보한 점은 대규모 클러스터를 운영해야 하는 기업들에게 매우 매력적인 요소입니다.

다만, 이러한 혁신적인 아키텍처가 실제 시장에서 성공하려면 생태계의 호환성 문제가 해결되어야 합니다. 새로운 표준(OEX)이 기존 NVIDIA 중심의 CUDA 생태계나 기존 네트워크 프로토콜과 얼마나 매끄럽게 통합될 수 있을지가 관건입니다. 만약 소프트웨어 스택의 파편화가 발생한다면, 하드웨어 비용 절감 효과보다 운영 복잡도 증가로 인한 비용 상승이 더 클 위험(Risk)이 있습니다.

따라서 스타트업 창업자들은 이러한 신규 아키텍처의 등장에 주목하되, 자사의 워크로드가 새로운 표준 환경에서도 성능 저하 없이 동작할 수 있는지 면밀히 검토하며 인프라 전략을 수립해야 합니다.

원문 보기 →