Google Cloud, Nvidia와 경쟁하기 위한 새로운 AI 칩 2개 출시

(techcrunch.com)

TechCrunch2026년 4월 22일AI 산업

Google Cloud, Nvidia와 경쟁하기 위한 새로운 AI 칩 2개 출시

구글 클라우드가 학습용 TPU 8t와 추론용 TPU 8i로 분리된 8세대 맞춤형 AI 칩(TPU)을 발표했습니다. 이번 신제품은 이전 세대 대비 최대 3배 빠른 학습 성능과 80% 향상된 비용 효율성을 목표로 하며, 엔비디아와의 경쟁과 협력을 동시에 추구하는 전략을 보여줍니다.

이 글의 핵심 포인트

1구글 8세대 TPU 출시: 학습용 TPU 8t와 추론용 TPU 8i로 이원화
2성능 및 효율성: 이전 세대 대비 최대 3배 빠른 학습 및 80% 개선된 비용 대비 성능
3확장성: 100만 개 이상의 TPU를 단일 클러스터로 연결 가능한 기술 확보
4하이브리드 전략: 자체 TPU와 엔비디아 최신 칩(Vera Rubin)을 동시에 제공하는 전략 유지
5기술 협력: 엔비디아 기반 시스템의 효율을 높이기 위한 소프트웨어 기반 네트워킹(Falcon) 공동 개발

이 글에 대한 공공지능 분석

왜 중요한가

AI 모델의 규모가 커짐에 따라 학습(Training)과 추론(Inference)에 필요한 컴퓨팅 자원의 특성이 분리되고 있습니다. 구글의 이번 결정은 특정 워크로드에 최적화된 칩을 통해 인프라 비용을 혁신적으로 낮추려는 시도이며, 이는 AI 서비스의 경제성을 결정짓는 핵심 요소입니다.

배경과 맥락

엔비디아 GPU의 높은 비용과 공급 부족 문제는 모든 하이퍼스케일러(Google, AWS, Azure)의 공통 과제입니다. 이에 따라 구글은 자체 설계한 TPU를 통해 엔비디나 의존도를 낮추는 동시에, 클라우드 고객들에게 더 저렴하고 효율적인 대안을 제공하여 인프라 주도권을 확보하려 하고 있습니다.

업계 영향

학습과 추론용 칩의 분리는 AI 모델 개발 생태계에 '최적화'라는 새로운 과제를 던집니다. 칩의 성능이 극대화됨에 따라 대규모 언어 모델(LLM)을 운영하는 기업들은 더 낮은 비용으로 서비스를 운영할 수 있는 기회를 얻게 되며, 이는 AI 서비스의 대중화를 가속화할 것입니다.

한국 시장 시사점

GPU 비용 부담이 큰 한국의 AI 스타트업들에게 구글의 TPU 생태계 확장은 매우 긍정적인 신호입니다. 특정 하드웨어에 종속되지 않고, 모델의 특성에 맞춰 학습은 TPU 8t, 서비스 운영은 TPU 8i를 활용하는 등 '멀티 인프라 전략'을 통해 운영 비용(OPEX)을 최적화하는 설계 역량이 중요해질 것입니다.

이 글에 대한 큐레이터 의견

이번 발표에서 주목해야 할 핵심은 구글이 엔비디아를 완전히 배제하는 것이 아니라, '협력적 경쟁(Coopetition)' 관계를 강화하고 있다는 점입니다. 구글은 자체 TPU로 비용 효율성을 높이는 동시에, 엔비디아의 최신 칩(Vera Rubin)과 네트워크 기술(Falcon)을 클라우드에 통합하여 고객에게 최상의 선택지를 제공하려 합니다. 이는 인프라 시장이 단일 패권 체제에서 '워크로드 최적화 체제'로 전환되고 있음을 의미합니다.

스타트업 창업자들은 이제 '어떤 GPU를 쓸 것인가'를 넘어 '어떤 칩 아키텍처에서 우리 모델이 가장 저렴하게 돌아갈 것인가'를 고민해야 합니다. 특히 추론용 칩(TPU 8i)의 성능 향상은 모델 경량화 및 최적화 기술을 가진 팀에게 거대한 기회입니다. 인프라의 변화에 맞춰 모델의 구조를 유연하게 설계할 수 있는 '하드웨어 애그노스틱(Hardware-agnostic)'한 개발 역량이 향후 AI 기업의 생존을 결정짓는 핵심 경쟁력이 될 것입니다.

원문 보기 →