어떤 AI 엔진이 어떤 자료를 인용하는가? (2026년 데이터)

(frase.io)

Frase Blog2026년 6월 9일SEO·GEO·AEO

AI 검색 엔진별로 인용하는 소스 데이터셋이 서로 매우 상이하여, 기존의 구글 SEO 방식으로는 ChatGPT나 Perplexity 같은 생성형 AI에서의 노출을 보장할 수 없다는 분석 결과가 나왔습니다.

이 글의 핵심 포인트

1AI 엔진 간 인용 소스의 중복률은 최저 16% 수준으로 매우 낮음
2ChatGPT는 Wikipedia와 권위 있는 미디어를 선호하며, Reddit 인용 비중이 최근 급감함
3Perplexity는 Reddit과 기술/전문가 소스를 중심으로 자체 크롤러를 활용함
4구글 상위 10위권 내 URL 중 단 12%만이 AI 어시스턴트의 인용 대상으로 나타남
5ChatGPT가 인용하는 페이지의 약 90%는 구글 검색 순위가 21위 이하인 경우가 많음

이 글에 대한 공공지능 분석

왜 중요한가?

기존의 '구글 1위가 곧 정답'이라는 공식이 AI 시대에는 무너지고 있으며, 각기 다른 데이터 소스를 사용하는 여러 AI 엔진에 대응하기 위한 다각적인 노출 전략이 기업의 디지털 가시성을 결정짓는 핵심 요소가 되었기 때문입니다.

어떤 배경과 맥락이 있나?

LLM 기반 검색 서비스들이 확산되면서 단순 웹 크롤링을 넘어 각 엔진만의 고유한 인덱싱 방식과 데이터 소스(Wikipedia, Reddit, 전문 매체 등)를 구축함에 따라 정보의 출처가 파편화되고 있습니다.

업계에 어떤 영향을 주나?

콘텐츠 마케팅 및 SEO 전략은 이제 단일 채널 최적화에서 벗어나, 엔진별 특성(커뮤니티 중심 vs 권위적 매체 중심)을 고려한 멀티 채널 데이터 배포 전략으로 전환되어야 합니다.

한국 시장에 어떤 시사점이 있나?

글로벌 플랫폼뿐만 아니라 로컬 검색 환경의 변화에 대응하는 국내 스타트업들은, 자사 서비스의 핵심 정보가 어떤 AI 엔진의 학습/인용 소스(예: Reddit, Wikipedia 등)에 포함될 수 있는지 분석하여 전략적인 콘텐츠 배포를 설계해야 합니다.

이 글에 대한 큐레이터 의견

이제 'SEO'라는 용어는 'GEO(Generative Engine Optimization)'로 재정의되어야 합니다. 과거에는 구글 검색 결과 상단 점유가 목표였다면, 이제는 ChatGPT의 권위적 소스나 Perplexity의 커뮤니티 기반 소스 등 각 엔진이 선호하는 데이터 유형에 맞춰 콘텐츠를 배치하는 정교한 전략이 필요합니다. 이는 단순한 콘텐츠 생산을 넘어, 자사의 브랜드 메시지가 어떤 형태(기술 문서, 사용자 리뷰, 뉴스 기사 등)로 존재해야 AI의 인용을 이끌어낼 수 있는지에 대한 고도의 데이터 엔지니어링적 접근을 요구합니다.

물론 이러한 다각화 전략에는 비용과 리소스라는 명확한 트레이드오프가 존재합니다. 모든 엔진에 맞춘 최적화는 막대한 콘텐츠 제작 비용을 발생시키며, 자칫 브랜드 메시지의 일관성을 해칠 위험도 있습니다. 따라서 스타트업은 모든 엔진을 공략하기보다, 자사의 타겟 고객이 주로 사용하는 AI 에이전트(예: 개발자라면 Perplexity/Claude, 일반 대중이라면 ChatGPT)를 우선순위로 정하고, 해당 엔진의 소스 특성에 집중하는 '선택과 집중' 전략을 취해야 합니다.

원문 보기 →