구글 검색창에 “재택근무 생산성 높이는 법”을 치면, 이제 구글은 링크 목록 대신 직접 답변을 써준다. 여러 웹페이지를 읽고 요약한 것이다. 그 답변에 내 글이 인용되는 것과 무시되는 것은 어떻게 결정될까? 운인가, 아니면 구조가 있는 것인가.
구조가 있다. 구글이 공식 문서에서 밝힌 두 가지 메커니즘, RAG와 Query Fan-out이 그것이다.
RAG: 리포트 쓰기 전에 자료 조사하는 학생
RAG는 Retrieval-Augmented Generation의 약자다. 직역하면 “검색으로 보강한 생성”인데, 쉽게 설명하면 이렇다.
AI가 답변을 만들기 전에, 먼저 인터넷에서 관련 글을 검색해 읽는다. 그 내용을 바탕으로 답변을 생성한다. 리포트를 쓰기 전에 자료 조사를 먼저 하는 학생처럼.
구글 공식 문서는 이를 세 단계로 설명한다.
- 사용자가 질문을 입력하면 구글의 핵심 검색 시스템이 관련 웹페이지를 인덱스에서 찾아온다.
- AI가 그 페이지들의 내용을 읽고 질문과 연결짓는다.
- 그 내용을 바탕으로 답변을 생성하고, 출처 링크와 함께 보여준다.
핵심은 AI가 아무 글이나 읽는 게 아니라는 점이다. 구글 검색 인덱스에 올라 있고, 구글 랭킹 시스템이 관련성 있다고 판단한 페이지만 읽는다. 그래서 구글 AI에서 인용되고 싶다면, 구글 검색에서 잘 노출되는 것(SEO)이 여전히 기본 조건이다.
RAG는 AI의 “할루시네이션(없는 내용을 있는 것처럼 말하는 현상)”도 줄여준다. 실제 웹페이지 내용을 읽고 답변을 만드니까, 학습 데이터에만 의존하는 것보다 더 정확하고 최신 정보를 담을 수 있다.
Query Fan-out: 질문 하나가 열 개로 쪼개진다
RAG만으로는 답이 충분하지 않을 때가 있다. 그래서 구글은 Query Fan-out을 쓴다.
사용자가 질문 하나를 입력하면, AI가 그 질문을 여러 개의 관련 질문으로 쪼개서 동시에 검색한다. 구글이 공식 문서에서 직접 든 예시가 있다.
사용자 질문: “잔디밭 잡초 제거법”
- “잔디밭에 좋은 제초제”
- “화학물질 없이 잡초 제거하는 법”
- “잔디 잡초 예방하는 법”
원래 질문은 하나였지만, AI가 질문의 맥락과 의도를 파악해 관련된 하위 질문들을 만들어낸 것이다. 각 하위 질문에 대한 검색 결과를 모아서 하나의 답변으로 통합한다.
구글 AI Mode에서는 이 규모가 훨씬 크다. 한 분석에 따르면 복잡한 질문의 경우 수백 개의 서브쿼리가 동시에 발행된다.
키워드 도배는 왜 더 이상 안 통할까?
이 두 메커니즘을 이해하면, 기존 SEO의 “키워드 도배” 전략이 왜 효과를 잃는지 보인다.
구글 공식 문서는 명확하게 말한다.
쿼리와 페이지 주요 콘텐츠 사이에 정확한 일치(exact match)가 없어도
AI 시스템은 관련 페이지를 인식한다.
Query Fan-out 때문이다. “잔디 잡초 제거법”이라는 키워드를 페이지에 10번 넣는 것보다, 잡초 제거의 원리·방법·주의사항을 깊이 있게 다루면 관련 서브쿼리 여러 개에서 동시에 잡힐 수 있다.
이를 뒷받침하는 데이터도 있다. SEO 분석 도구 Surfer SEO가 1만 개 키워드를 분석한 결과, AI Overviews에 인용된 페이지의 67.82%는 해당 키워드 자연 검색 상위 10위 안에 없었다. AI 인용과 전통적인 키워드 랭킹은 상관관계가 있지만 같은 기준이 아니라는 뜻이다.
그래서 콘텐츠 전략이 어떻게 바뀌어야 할까?
RAG와 Query Fan-out을 이해한 뒤 콘텐츠를 볼 때 던져야 할 질문이 달라진다.
- 기존 전략: “이 키워드가 충분히 들어갔나?”
- 새로운 전략: “이 주제를 다각도로 충분히 깊이 다뤘나? 관련 질문들에도 답하고 있나?”
구글은 AI가 “동의어와 관련 의미까지 이해한다”고 명시했다. 하나의 주제를 직접 경험과 구체적 데이터로 깊이 파고든 글이, 키워드를 반복한 글보다 여러 서브쿼리에 걸쳐 인용될 확률이 높다.
다음 편에서는 구글이 공식 문서에서 직접 제시한 개념, “누구나 쓸 수 있는 글(commodity content)”과 “당신만 쓸 수 있는 글(non-commodity content)”의 차이를 살펴보자.
FAQ
아닙니다. ChatGPT Search, Perplexity도 RAG 방식을 사용합니다. 다만 무엇을 검색 소스로 쓰는지가 다릅니다. 구글은 자체 검색 인덱스를, ChatGPT Search는 Bing 인덱스를, Perplexity는 실시간 크롤링을 사용합니다.
오히려 반대입니다. 특정 롱테일 키워드를 직접 타겟하지 않아도, 주제를 깊이 다룬 글이 AI가 생성한 서브쿼리에 자연스럽게 잡힐 수 있습니다. “키워드 하나씩 노리기”보다 “하나의 주제를 입체적으로 다루기”가 더 효과적인 전략이 됩니다.
직접적인 확인 도구는 아직 없습니다. 구글 Search Console에서는 AI Overviews 노출 데이터를 일부 제공합니다. 또는 내 글의 주제와 관련된 질문을 구글에 직접 검색해 AI 답변에 출처로 잡히는지 수동으로 확인할 수 있습니다.
반드시 그렇지는 않습니다. 1편에서 다뤘듯, AI 요약 내 링크 클릭률은 1%에 불과합니다. 인용이 트래픽보다는 브랜드 인지도와 신뢰도에 더 영향을 줄 수 있습니다.
구글 AI Overviews·AI Mode 기준으로, 인덱싱되지 않았거나 스니펫(요약 미리보기)이 막혀 있는 페이지는 RAG 대상에서 제외됩니다. 기술적 SEO 기본기(크롤 가능, 색인 가능 상태)가 전제 조건입니다.
AiLit에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

