구글, "에이전트 시대"를 위한 새로운 TPU 2종 공개
(arstechnica.com)
구글이 학습용 8t와 추론용 8i로 이원화된 8세대 TPU 2종을 공개하며, AI 모델 학습 속도와 추론 효율성을 극대화함으로써 자율적 에이전트 시대의 핵심 과제인 운영 비용 절감과 인프라 최적화를 추진하고 있습니다.
이 글의 핵심 포인트
- 18세대 TPU의 이원화: 학습 전용 TPU 8t와 추론 전용 TPU 8i로 분리 출시
- 2학습 혁신: TPU 8t는 대규모 모델 학습 기간을 개월 단위에서 주 단위로 단축 목표
- 3추론 최적화: TPU 8i는 384MB의 온칩 SRAM을 탑재하여 긴 컨텍스트 처리 능력 강화