XPENG, 월드 모델 기술 보고서 공개, VLA 2.0 모델 R&D 및 검증 지원
(cleantechnica.com)
XPENG가 공개한 생성형 월드 모델 'X-World'는 비디오 확산 기술을 통해 물리적으로 일관된 미래 주행 시나리오를 생성함으로써, 자율주행 AI의 엣지 케이스 학습을 극대화하고 VLA 2.0 모델의 성능을 높이는 핵심 인프라 역할을 할 것으로 기대됩니다.
이 글의 핵심 포인트
- 1XPENG의 X-World는 비디오 확산(Diffusion) 기술 기반의 다각도 생성형 월드 모델임
- 23D Causal Autoencoder(VAE)와 DiT 구조를 통해 연산 효율성과 긴 시퀀스 모델링을 동시에 달약
- 3