VOID: 비디오 객체 및 상호작용 삭제
(github.com)
넷플릭스 연구진이 개발한 VOID는 비디오에서 특정 객체를 삭제할 때, 그 객체가 유발하던 물리적 상호작용(예: 물체를 들고 있던 사람이 사라지면 물체가 떨어지는 현상)까지 함께 제거하여 자연스러운 배경을 생성하는 혁신적인 비디오 인페인팅 기술입니다. CogVideoX를 기반으로 하며, SAM2와 Gemini를 활용해 물리적 영향권까지 계산하여 마스킹하는 것이 핵심입니다.
이 글의 핵심 포인트
- 1넷플릭스 및 소피아 대학 연구진 개발 (물리적 상호작용 제거 기술)
- 2단순 객체 삭제를 넘어 물체가 떨어지는 등의 물리적 변화까지 재구성
- 3CogVideoX 기반의 2단계(Pass 1 & 2) 트랜스포머 아키텍처 사용