보고서: Meta, 직원들의 마우스 및 키보드 사용 추적을 통해 AI 에이전트 훈련

(arstechnica.com)

Ars Technica2026년 4월 21일AI 코딩

보고서: Meta, 직원들의 마우스 및 키보드 사용 추적을 통해 AI 에이전트 훈련

Meta가 AI 에이전트의 컴퓨터 조작 능력을 고도화하기 위해 미국 내 직원들의 마우스 움직임, 클릭, 키보드 입력 등을 추적하는 새로운 소프트웨어를 도입합니다. 이는 텍스트나 이미지를 넘어 실제 디지털 환경에서의 '행동 데이터(Action Data)'를 확보하여 AI의 실행 능력을 높이려는 전략적 움직임입니다.

이 글의 핵심 포인트

1Meta, AI 에이전트 훈련을 위해 미국 직원들의 마우스/키보드 사용 패턴 추적 시작
2수집 데이터에는 클릭, 키보드 입력 및 맥락 파악을 위한 주기적 스크린샷 포함
3텍스트/이미지 대비 확보하기 어려운 '디지털 행동 데이터' 확보가 핵심 목적
4OpenAI, Anthropic 등 글로벌 빅테크 간의 AI 에이전트 주도권 경쟁 심화
5유럽(EU)의 강력한 개인정보 보호법으로 인해 미국 외 지역 적용은 제한적

이 글에 대한 공공지능 분석

왜 중요한가

단순히 정보를 생성하는 단계를 넘어, 컴퓨터를 직접 조작하는 'AI 에작트' 시대로의 전환을 의미합니다. 텍스트나 이미지 데이터는 이미 포화 상태에 이르렀으나, 실제 사용자의 디지털 인터랙션 패턴은 매우 희소하며 모델의 '실행 능력'을 결정짓는 핵심 요소이기 때문입니다.

배경과 맥락

OpenAI, Anthropic, Google 등 글로벌 빅테크들은 브라우저나 컴퓨터를 제어하는 에이전트 개발 경쟁 중입니다. 이러한 에이전트가 드롭다운 메뉴 클릭, 버튼 누르기 등 복잡한 워크플로우를 수행하려면 인간의 실제 조작 데이터가 필수적이며, Meta는 이를 자사 직원의 업무 패턴을 통해 확보하려는 것입니다.

업계 영향

데이터 확보 경쟁의 중심이 '콘텐츠(Content)'에서 '행동(Action)'으로 이동할 것입니다. 이는 향후 AI 모델의 성능 차별화가 단순 알고리즘의 우위가 아닌, 얼마나 정교하고 고품질의 인터랙션 데이터를 보유했느냐에 따라 결정될 것임을 시사합니다.

한국 시장 시사점

한국의 AI 스타트업들은 범용 에이전트 시장에서 빅테크와 데이터 규모로 경쟁하기 어렵습니다. 대신 특정 산업군(금융, 의료, 제조 등)의 전문 소프트웨어 내에서 발생하는 특화된 '행동 데이터'를 확보하여, 특정 태스크에 압도적인 숙련도를 가진 버티컬 에이전트를 구축하는 전략이 유효합니다.

이 글에 대한 큐레이터 의견

이제 AI의 경쟁력은 '무엇을 아는가(Knowledge)'에서 '무엇을 할 수 있는가(Action)'로 이동하고 있습니다. Meta의 이번 결정은 LLM(대규모 언어 모델)의 다음 단계인 LAM(대규모 행동 모델)을 선점하기 위한 데이터 확보 전쟁의 서막입니다. 창업자들은 이제 텍스트 데이터의 양에 집착하기보다, 특정 태스크를 완수하기 위한 '디지털 숙련도'를 학습시킬 수 있는 고품질의 인터랙션 데이터를 어떻게 확보할 것인지 고민해야 합니다.

빅테크가 직원들의 행동까지 추적하며 데이터 확보에 나서는 상황에서, 스타트업은 데이터의 '규모'가 아닌 '밀도'와 '도메인 특화성'에 집중해야 합니다. 범용적인 클릭 데이터는 Meta와 같은 거대 기업이 압도하겠지만, 특정 전문 소프트웨어(예: CAD, 전문 회계 프로그램, 특정 ERP) 내에서의 정교한 조작 데이터는 스타트업이 독점할 수 있는 강력한 해자(Moat)가 될 수 있습니다.

원문 보기 →