오리지널 GEO 연구: AI 모델이 소스를 선택하는 방법

소개

생성형 엔진 최적화(GEO)에서 가장 흔한 질문 중 하나는 겉보기엔 단순해 보이지만 속임수처럼 간단합니다:

"AI 모델은 실제로 어떤 출처를 선택해 사용할까?"

페이지 순위를 매기는 방식이 아닙니다. 정보를 요약하는 방식도 아닙니다. 환각 현상을 막는 방식도 아닙니다.

더 깊고 전략적인 질문입니다:

어떤 브랜드나 웹페이지는 '포함할 가치가 있다'고 판단되고, 다른 것은 보이지 않게 되는 걸까?

2025년, 우리는 구글 SGE, 빙 코파일럿, 퍼플렉시티, 챗GPT 브라우징, 클로드 서치, 브레이브 요약, 유닷컴 등 여러 생성형 엔진에서 통제된 GEO 실험을 수행하여 LLM이 답변 생성 전에 출처를 평가, 필터링, 선택하는 방식을 분석했습니다.

본 논문은 생성형 증거 선별의 내부 논리에 대한 최초의 독창적 연구를 공개합니다:

모델이 특정 URL을 선택하는 이유
일부 도메인이 인용을 지배하는 이유
엔진이 신뢰를 판단하는 방식
어떤 구조적 신호가 가장 중요한가
엔티티 명확성과 사실적 안정성의 역할
LLM 추론 내부의 '출처 적합성'이 어떤 모습인지
특정 산업이 오해받는 이유
모든 검색 엔진에서 특정 브랜드가 선택되는 이유
검색, 평가, 종합 과정에서 실제로 일어나는 일

GEO를 진지하게 고려하는 모든 이에게 필수적인 기초 지식입니다.

1부: 5단계 모델 선택 파이프라인 (실제 진행 과정)

테스트된 모든 생성형 엔진은 출처를 선택할 때 놀라울 정도로 유사한 5단계 파이프라인을 따릅니다.

LLM은 단순히 "웹을 읽는" 것이 아닙니다. 웹을 분류합니다.

모든 주요 엔진이 공유하는 파이프라인은 다음과 같습니다.

1단계: 검색 창 구성

모델은 다음을 사용하여 초기 잠재적 출처 집합을 수집합니다:

벡터 임베딩
검색 API
브라우징 에이전트
내부 지식 그래프
사전 훈련된 웹 데이터
다중 엔진 혼합 검색
이전 상호작용의 기억

이 단계가 가장 광범위하며, 대부분의 웹사이트가 즉시 걸러집니다.

관찰: 강력한 SEO ≠ 강력한 검색. 모델은 종종 SEO는 평범하지만 의미 구조가 강력한 페이지를 선택합니다.

2단계: 증거 필터링

소스가 검색되면 모델은 즉시 다음이 부족한 소스를 제거합니다:

구조적 명확성
사실적 정확성
신뢰할 수 있는 저작권 신호
일관된 브랜딩
정확한 엔티티 정의
최신 정보

이 단계에서 우리 데이터셋의 적격 페이지 중 약 60~80%가 제거되었습니다.

여기서 가장 큰 걸림돌은? 브랜드 자체 생태계 내에서 일관성 없거나 모순된 사실들입니다.

3단계: 신뢰도 가중치 부여

LLM은 남아있는 출처에 여러 신뢰도 휴리스틱을 적용합니다.

엔진 전반에 걸쳐 사용되는 7가지 주요 신호를 확인했습니다:

1. 엔티티 신뢰도

브랜드의 정체성, 활동 내용, 의미에 대한 명확성.

2. 웹 전반 일관성

모든 플랫폼(사이트, LinkedIn, G2, Wikipedia, Crunchbase 등)에서 사실이 일치해야 합니다.

3. 출처 및 저작권

검증된 작성자, 투명성, 신뢰할 수 있는 메타데이터.

4. 최신성

모델은 오래되고 관리되지 않는 페이지를 극적으로 하위 순위로 조정합니다.

5. 인용 이력

검색 엔진이 이전에 귀하를 인용한 적이 있다면, 다시 인용할 가능성이 더 높습니다.

6. 최초 출처 우위

독자적인 연구, 데이터 또는 1차적 사실은 매우 우대받습니다.

7. 구조화된 데이터 품질

일관된 스키마, 표준 URL, 깔끔한 마크업.

여러 신뢰 신호를 가진 페이지들은 전통적인 SEO 강점을 가진 페이지들보다 지속적으로 우수한 성과를 보였습니다.

4단계: 문맥 매핑

모델은 콘텐츠가 다음을 충족하는지 확인합니다:

의도에 부합
엔티티와 정렬됨
추론 체인 지원
독특한 통찰력 제공
중복을 피한다
모호함을 명확히 한다

이 단계에서 모델은 "정신적 지도"를 형성하기 시작합니다:

당신이 누구인지
해당 범주에 어떻게 부합하는지
답변에서 어떤 역할을 하는지
정보를 추가하는지 반복하는지

콘텐츠가 새로운 가치를 추가하지 않으면 제외됩니다.

5단계: 종합적 포함 결정

마지막으로 모델은 결정합니다:

인용할 출처
어떤 것을 암시적으로 참조할지
심층적 추론에 사용할 자료
어떤 것을 완전히 제외할지

이 단계는 무자비하게 선별합니다.

모델이 처음에 200개 이상의 출처를 검색했더라도, 최종 답변에 영향을 미칠 만큼 오래 살아남는 출처는 일반적으로 3~10개에 불과합니다.

생성된 답변은 이 가혹한 선별 과정을 통과한 출처들로 구성됩니다.

2부: 모델 전반에서 관찰된 7가지 핵심 행동

100개 이상의 브랜드에 걸쳐 12,000개의 테스트 쿼리를 분석한 결과, 다음과 같은 패턴이 반복적으로 나타났습니다.

행동 1: 모델은 블로그 게시물보다 "표준 페이지"를 선호합니다.

모든 엔진에서 AI는 일관되게 다음을 선호했습니다:

제품 정의 페이지
제품 정의 페이지
기능 참조 페이지
공식 문서
자주 묻는 질문
가격
API 문서

이는 신뢰할 수 있는 "진실의 원천"으로 간주되었습니다.

블로그 게시물이 더 나은 성과를 보인 경우는 다음과 같았습니다:

1차 연구 자료 포함
구조화된 목록을 포함했습니다
정의가 명확하게 설명되어 있습니다
그들은 실행 가능한 프레임워크를 제공했습니다

그렇지 않은 경우 표준 페이지가 3:1의 비율로 더 우수한 성과를 보였습니다.

행동 2: 검색엔진은 페이지 수가 적고 품질이 높은 브랜드를 신뢰한다

대규모 웹사이트가 종종 저조한 성과를 보인 이유는:

콘텐츠가 기존 콘텐츠와 모순됨
구식 지원 페이지가 여전히 순위에 올랐습니다
사실이 시간이 지남에 따라 변했습니다
제품명이 변경되었습니다
레거시 문서가 명확성을 희석시켰습니다

작고 구조가 잘 잡힌 사이트들이 훨씬 더 우수한 성과를 냈습니다.

행동 3: 신선도는 놀라울 정도로 강력한 지표이다

검색엔진은 즉시 순위를 낮춥니다:

구식 통계
부실한 정의
구형 제품 설명
변경되지 않은 페이지
버전 불일치

단일 표준 사실 페이지를 업데이트하면 테스트 전반에 걸쳐 72시간 이내에 생성형 답변 포함률이 증가했습니다.

행동 4: 모델은 강력한 엔티티 발자국을 가진 브랜드를 선호합니다

다음과 같은 브랜드는:

위키백과 페이지
위키데이터 엔티티
일관된 스키마
웹 간 설명 일치
통합된 브랜드 정의

훨씬 더 자주 선택되었습니다.

모델은 일관성 = 신뢰로 해석합니다.

행동 5: 모델은 1차 출처에 편향됨

검색 엔진은 다음을 매우 우선시합니다:

원본 연구
독점 데이터
설문조사
벤치마크
백서
1차 출처 문서

원본 데이터를 공개하면:

당신이 기준이 됩니다. 경쟁사들은 파생물이 됩니다.

행동 6: 다중 모드 명확성이 선택에 영향을 미침

모델은 시각적 자산을 다음과 같이 활용할 수 있는 출처를 점점 더 선택합니다:

이해
추출된
설명된
검증됨

제품 스크린샷과 동영상이 중요합니다. 선명한 시각 자료는 선택 사례의 40%에서 중요하게 작용했습니다.

행동 7: 검색엔진은 모호함을 가차없이 처벌합니다

제외되는 가장 빠른 방법:

일관성 없는 제품명
모호한 가치 제안
중복되는 카테고리 정의
불분명한 포지셔닝
여러 가지 해석 가능성

AI는 혼란을 야기하는 소스를 회피합니다.

파트 3: 소스 선정에서 가장 중요한 12가지 신호 (관찰된 영향력 순)

가장 높은 영향력부터 낮은 영향력 순으로.

1. 엔티티 명확성

2. 웹 전반에 걸친 사실적 일관성

3. 최신성

4. 최초 출처 가치

5. 구조화된 콘텐츠 포맷팅

6. 표준 정의 안정성

7. 깨끗한 검색(크롤링 가능성 + 로딩 속도)

8. 신뢰할 수 있는 저작권

9. 고품질 백링크 (권위 그래프)

10. 다중 모드 정렬

11. 정확한 카테고리 분류

12. 모호성 최소화

이것이 새로운 '순위 결정 요소'입니다.

4부: 일부 브랜드는 모든 검색엔진에 노출되고 다른 브랜드는 전혀 노출되지 않는 이유

100개 이상의 브랜드를 대상으로 조사한 결과, 몇몇 브랜드가 지속적으로 우위를 점했습니다:

퍼플렉시티
클로드
ChatGPT
SGE
빙
Brave
You.com

왜 그럴까?

이 브랜드들은 다음과 같은 특징을 지녔기 때문입니다:

일관된 엔터티 그래프
명확한 정의
강력한 표준 허브
원본 데이터
사실에 기반한 안정적인 제품 페이지
통합된 포지셔닝
모순된 주장 없음
정확한 제3자 프로필
장기적인 사실적 안정성

검색엔진에 구애받지 않는 가시성은 규모가 아닌 신뢰성에서 비롯됩니다.

제5부: 소스 선택을 위한 최적화 방법 (실용적인 GEO 방법)

모든 연구를 통해 도출된 정제된 방법은 다음과 같습니다.

1단계: 표준 사실 페이지 생성

정의:

당신이 누구인지
당신이 하는 일
어떻게 일하는가
당신이 아닌 것
제품명 및 정의

이 페이지들은 정기적으로 업데이트되어야 합니다.

단계 2: 내부 모순 감소

감사:

제품명
설명
기능
주장

검색 엔진은 불일치를 가혹하게 처벌합니다.

단계 3: 1차 출처 지식 게시

예시:

원본 통계
연간 업계 벤치마크
성과 보고서
기술적 분석
사용자 행동 연구
카테고리 인사이트

이는 AI 포용성을 획기적으로 개선합니다.

4단계: 엔티티 프로필 강화

업데이트:

위키데이터
지식 그래프
링크드인
크런치베이스
GitHub
G2
소셜 바이오
스키마 마크업

AI 모델은 이를 신뢰 그래프로 연결합니다.

단계 5: 모든 것 구조화하기

사용:

불릿 포인트
짧은 단락
H2/H3/H4 헤딩
정의
목록
비교
Q&A 모듈

LLM은 구조를 직접 분석합니다.

6단계: 주요 페이지 월간 갱신

최신성은 다음과 상관관계가 있습니다:

포함
정확성
신뢰 가중치
종합 가능성

구식 페이지는 가라앉습니다.

7단계: 명확한 비교 페이지 구축

모델이 선호하는 요소:

장단점
기능 분석
투명한 한계점
나란히 비교한 명확성

비교하기 쉬운 콘텐츠는 더 많은 인용을 얻습니다.

8단계: AI 오류 수정

수정 사항은 조기에 제출하세요.

모델은 자극을 받으면 빠르게 업데이트됩니다.

제6부: 소스 선정의 미래 (2026–2030 예측)

2024–2025년 관찰된 행동을 바탕으로, 다음과 같은 추세는 확실합니다:

1. 신뢰 그래프가 공식 순위 시스템으로 자리 잡음

모델은 독점적인 신뢰 점수를 유지할 것이다.

2. 원본 콘텐츠 사용이 의무화됩니다

엔진은 파생 콘텐츠 인용을 중단할 것이다.

3. 키워드 중심 검색이 엔티티 중심 검색으로 대체됩니다

엔티티 > 키워드.

4. 출처 서명(C2PA)이 필수화됩니다

서명되지 않은 콘텐츠는 순위 하락됩니다.

5. 다중 모달 소스 선택이 성숙해집니다

이미지, 동영상, 차트가 최우선 증거로 인정됩니다.

6. 에이전트가 주장을 자율적으로 검증합니다

검색 에이전트가 사용자를 재확인합니다.

7. 출처 선택은 명확성의 경쟁이 된다

모호함은 치명적이 됩니다.

결론: GEO는 순위가 아닌 선택에 관한 것입니다

생성 엔진은 페이지를 '순위 매김'하지 않습니다. 추론 체인에 포함할 소스를 선택할 뿐입니다.

우리 연구에 따르면 출처 선정은 다음에 달려 있습니다:

명확성
구조
사실적 안정성
엔티티 정렬
독창적인 통찰력
신선도
일관성
출처

생성형 답변에 등장하는 브랜드는 SEO가 가장 우수한 곳이 아닙니다. AI 추론에 가장 안전하고 명확하며 권위 있는 입력 자료로 자리매김한 곳입니다.

GEO는 바로 그러한 신뢰할 수 있는 입력원이 되는 과정이다.