스키마, LLM과 GEO에서 '증거'의 낮은 기준
(searchenginejournal.com)
LLM이 스키마 마크업을 구조적으로 파싱하는 것이 아니라 단순 텍스트의 연장선으로 인식하여 데이터를 추출한다는 실험 결과는, 현재 유행하는 GEO(생성형 엔진 최적화) 전략의 실효성에 대한 근본적인 의문을 제기합니다.
이 글의 핵심 포인트
- 1실험 결과 LLM은 문법적으로 오류가 있는 JSON-LD 스키마에서도 데이터를 정확히 추출함
- 2LLM은 스키마를 구조적 데이터로 파싱하기보다 페이지 내의 추가적인 텍스트로 처리하는 경향이 있음
- 3GEO 전문가들이 주장하는 '스키마 마크업을 통한 인용 유도' 전략은 근거가 다소 빈약할 수 있음
- 4Schema.org의 본래 목적은 검색 엔진의 모호성 제거(Disambiguation)를 위한 것임
- 5LLM 시대의 데이터 최적화는 구조적 규칙 준수보다 텍스트 내 정보의 명확성이 더 중요할 수 있음
이 글에 대한 공공지능 분석
왜 중요한가?
LLM 기반 검색(Perplexity 등) 시대에 웹사이트의 데이터 구조화 전략이 실제 AI 모델의 정보 추출 방식과 일치하는지 검증하기 때문입니다. 이는 마케팅 비용과 기술적 리소스 배분의 우선순위를 결정짓는 핵심적인 문제입니다.
어떤 배경과 맥락이 있나?
기존 검색 엔진은 모호성을 제거하기 위해 Schema.org를 활용해 왔으나, 최근 GEO(Generative Engine Optimization) 전문가들은 스키마 마크업이 LLM의 인용을 유도하는 강력한 도구라고 주장하며 이를 적극 권장하고 있습니다.
업계에 어떤 영향을 주나?
만약 LLM이 구조적 파싱 없이 텍스트로만 데이터를 처리한다면, 정교한 스키마 설계보다는 양질의 텍스트 콘텐츠를 배치하는 것이 더 효율적인 전략이 될 수 있습니다. 이는 SEO/GEO 에이전시들의 서비스 모델에 변화를 요구할 수 있습니다.
한국 시장에 어떤 시사점이 있나?
글로벌 표준인 Schema.org의 기술적 완결성에 과도하게 의존하기보다, LLM이 읽기 쉬운 자연어 문맥과 구조화된 정보를 조화롭게 배치하는 '콘텐츠 중심의 최적화' 전략이 국내 기업들에게 더 유효할 수 있습니다.
이 글에 대한 큐레이터 의견
현재 GEO 업계에서 스키마 마크업을 통한 데이터 주입이 LLM 인용의 치트키처럼 묘사되는 경향이 있습니다. 하지만 이번 실험은 LLM이 구조적 규칙을 준수하는 '파서(Parser)'라기보다는, 주어진 모든 텍스트를 확률적으로 처리하는 '패턴 매칭 엔진'에 가깝다는 점을 시사합니다. 따라서 스타트업 창업자들은 스키마의 기술적 정확도에 집착하기보다, 모델이 데이터 간의 관계를 명확히 인지할 수 있는 문맥적 풍부함에 더 많은 리소스를 투입해야 합니다. \물론 반론도 가능합니다. LLM이 비록 구조적으로 파싱하지 않더라도, JSON-LD 형식이 정보의 밀도를 높여주어 결과적으로 모델의 어텐션(Attention)을 끌기 쉽게 만드는 '가시성 증대' 효과는 분명히 존재할 수 있습니다. 즉, 스키마를 기술적 계약서가 아닌, 모델에게 핵심 정보를 강조하는 '하이라이터(Highlighter)'로 활용하는 영리한 접근이 필요합니다. 결국 기술적 완결성보다는 정보의 명확성을 높이는 도구로서 스키마를 바라보는 균형 잡힌 시각이 요구됩니다.
댓글
아직 댓글이 없습니다. 첫 댓글을 남겨보세요.