• GEO

Оригинални изследвания на GEO: Как моделите на изкуствения интелект избират източниците

  • Felix Rose-Collins
  • 6 min read

Въведение

Един от най-често задаваните въпроси в областта на генеративната оптимизация на търсачките (GEO) е измамно прост:

„Как AI моделите всъщност избират кои източници да използват?“

Не как класифицират страниците. Не как обобщават информацията. Не как спират халюцинациите.

А по-дълбокият, по-стратегически въпрос:

Какво прави една марка или уеб страница „достойна за включване“, а друга – невидима?

През 2025 г. проведохме серия от контролирани GEO експерименти в няколко генеративни двигателя – Google SGE, Bing Copilot, Perplexity, ChatGPT Browsing, Claude Search, Brave Summaries и You.com – за да анализираме как LLM оценяват, филтрират и избират източници, преди да генерират отговор.

Запознайте се с Ranktracker

Универсалната платформа за ефективна SEO оптимизация

Зад всеки успешен бизнес стои силна SEO кампания. Но с безбройните инструменти и техники за оптимизация, от които можете да избирате, може да е трудно да разберете откъде да започнете. Е, не се страхувайте повече, защото имам точно това, което ще ви помогне. Представяме ви платформата Ranktracker "всичко в едно" за ефективна SEO оптимизация

Най-накрая отворихме регистрацията за Ranktracker напълно безплатно!

Създаване на безплатен акаунт

Или влезте в системата, като използвате данните си

Тази статия разкрива първото оригинално проучване на вътрешната логика на генеративния подбор на доказателства:

  • защо моделите избират определени URL адреси

  • защо някои домейни доминират цитиранията

  • как двигателите преценяват доверието

  • кои структурни сигнали са най-важни

  • ролята на яснотата на субекта и фактическата стабилност

  • как изглежда „подходящ източник“ в разсъжденията на LLM

  • защо някои индустрии се интерпретират погрешно

  • защо някои марки се избират във всички търсачки

  • какво всъщност се случва по време на извличане, оценка и синтез

Това е фундаментално знание за всеки, който се интересува сериозно от GEO.

Част 1: Петстепенен модел за подбор (какво всъщност се случва)

Всички тествани генеративни двигатели следват удивително сходен петстепенен процес при избора на източници.

LLM не просто „четат уеб“. Те сортират уеб.

Ето процеса, който всички основни двигатели споделят.

Етап 1: Изграждане на прозорец за извличане

Моделът събира първоначален набор от потенциални източници, като използва:

  • векторни вграждания

  • API за търсене

  • агенти за преглед

  • вътрешни графики на знания

  • предварително обучени уеб данни

  • многодвигателно смесено извличане

  • памет за предишни взаимодействия

Това е най-широкият етап – и мястото, където повечето уебсайтове се филтрират незабавно.

Наблюдение: Силно SEO ≠ силно извличане. Моделите често избират страници с посредствено SEO, но със силна семантична структура.

Етап 2: Филтриране на доказателства

След като източниците бъдат извлечени, моделите незабавно елиминират тези, които не отговарят на изискванията:

  • структурна яснота

  • фактическа точност

  • сигнали за надеждно авторство

  • последователен брандинг

  • правилни дефиниции на обектите

  • актуална информация

Тук ~60–80% от подходящите страници бяха отхвърлени в нашия набор от данни.

Най-големият убиец тук? Несъответстващи или противоречиви факти в собствената екосистема на марката.

Етап 3: Претегляне на доверието

LLM прилагат множество хеуристики за доверие към останалите източници.

Идентифицирахме седем основни сигнала, използвани в различните двигатели:

1. Доверие в субекта

Яснота относно това какво представлява, прави и означава марката.

2. Съвместимост в интернет

Фактите трябва да съвпадат във всички платформи (сайт, LinkedIn, G2, Wikipedia, Crunchbase и др.).

3. Произход и авторство

Проверени автори, прозрачност и надеждни метаданни.

4. Актуалност

Моделите драстично понижават рейтинга на остарелите и неподдържани страници.

5. История на цитиране

Ако търсачките са ви цитирали преди, е по-вероятно да ви цитират отново.

6. Предимство на първичния източник

Оригиналните проучвания, данни или първични факти се ползват с голямо предпочитание.

7. Качество на структурираните данни

Последователна схема, канонични URL адреси и чист маркиращ код.

Запознайте се с Ranktracker

Универсалната платформа за ефективна SEO оптимизация

Зад всеки успешен бизнес стои силна SEO кампания. Но с безбройните инструменти и техники за оптимизация, от които можете да избирате, може да е трудно да разберете откъде да започнете. Е, не се страхувайте повече, защото имам точно това, което ще ви помогне. Представяме ви платформата Ranktracker "всичко в едно" за ефективна SEO оптимизация

Най-накрая отворихме регистрацията за Ranktracker напълно безплатно!

Създаване на безплатен акаунт

Или влезте в системата, като използвате данните си

Страниците с множество сигнали за доверие последователно превъзхождат тези с традиционна SEO сила.

Етап 4: Контекстуално картографиране

Моделът проверява дали вашето съдържание:

  • съответствие с намерението

  • съответства на субекта

  • подкрепя веригата от разсъждения

  • допринася за уникална перспектива

  • избягва излишната информация

  • изяснява двусмислието

Тук моделът започва да формира „ментална карта”:

  • кой сте

  • как се вписвате в категорията

  • каква роля играете в отговора

  • дали добавяте или повтаряте информация

Ако вашето съдържание не добавя нова стойност, то се изключва.

Етап 5: Решение за включване в синтеза

Накрая моделът взема решение:

  • кои източници да цитирате

  • кои да цитирате имплицитно

  • кои да използвате за задълбочено разсъждение

  • кои да изключите напълно

Този етап е безмилостно селективен.

Обикновено само 3–10 източника оцеляват достатъчно дълго, за да повлияят на окончателния отговор – дори ако моделът е извлекъл над 200 в началото.

Генеративният отговор се изгражда от победителите в тази надпревара.

Част 2: Седемте основни поведения, които наблюдавахме в моделите

От 12 000 тестови заявки за над 100 марки се очертаха следните модели.

Поведение 1: Моделите предпочитат „канонични страници“ пред блог публикации

Във всички търсачки AI последователно предпочиташе:

  • Страници „За нас“

  • Страници с определения на продукти

  • Страници с информация за функциите

  • Официална документация

  • Често задавани въпроси

  • Цени

  • Документация за API

Те бяха разглеждани като надеждни „източници на истина“.

Блог постовете се представяха по-добре само когато:

  • съдържат изследвания от първа ръка

  • включват структурирани списъци

  • те изясняваха определенията

  • те предоставиха приложими рамки

В противен случай каноничните страници ги превъзхождаха с 3:1.

Поведение 2: Търсачките се доверяват на марки с по-малко, но по-качествени страници

Големите уебсайтове често се представяха по-слабо, защото:

  • съдържанието противоречеше на по-старо съдържание

  • остарелите страници за поддръжка все още се класираха

  • фактите се променяха с времето

  • имената на продуктите се промениха

  • старите статии намаляваха яснотата

Малките, добре структурирани сайтове се представяха значително по-добре.

Поведение 3: Актуалността е изключително силен индикатор

Търсачките незабавно понижават рейтинга:

  • остарели статистически данни

  • остарели дефиниции

  • стари описания на продукти

  • непроменени страници

  • несъответствия между версиите

Актуализирането на една канонична страница с факти увеличи включването в генеративните отговори в рамките на 72 часа в нашите тестове.

Поведение 4: Моделите предпочитат марки с силно присъствие

Марките с:

  • страница в Уикипедия

  • единица от Wikidata

  • последователна схема

  • съвпадащи описания в интернет

  • унифицирана дефиниция на марката

бяха избирани много по-често.

Моделите интерпретират последователността като доверие.

Поведение 5: Моделите са пристрастни към първичните източници

Търсачките дават голямо предимство на:

  • оригинални проучвания

  • собствени данни

  • проучвания

  • бенчмарки

  • бели книги

  • документация от първи източник

Ако публикувате оригинални данни:

Вие ставате еталон. Конкурентите стават производни.

Поведение 6: Мултимодалната яснота влияе върху избора

Моделите все по-често избират източници, чиито визуални активи могат да бъдат:

  • разбрани

  • извлечени

  • описани

  • проверени

Снимките и видеоклиповете на продуктите са важни. Чистите визуални елементи са важни в 40% от случаите на избор.

Поведение 7: Двигателите безмилостно наказват двусмислието

Най-бързият начин да бъдете изключени:

  • несъвместими имена на продукти

  • неясни предложения за стойност

  • припокриващи се дефиниции на категории

  • неясно позициониране

  • многобройни възможни интерпретации

AI избягва източници, които създават объркване.

Част 3: 12-те най-важни сигнали при избора на източник (подредени според наблюдавания ефект)

От най-голямо до най-малко въздействие.

1. Яснота на субекта

2. Съвместимост на фактите в интернет

3. Актуалност

4. Стойност на първичния източник

5. Структурирано форматиране на съдържанието

6. Стабилност на каноничната дефиниция

7. Чисто извличане (възможност за индексиране + скорост на зареждане)

8. Надеждно авторство

9. Висококачествени обратни връзки (графика на авторитета)

10. Мултимодално подреждане

11. Правилно поставяне в категория

12. Минимална двусмисленост

Това са новите „фактори за класиране“.

Част 4: Защо някои марки се появяват във всички търсачки (а други – в нито една)

Сред над 100 марки няколко доминираха последователно:

  • Объркване

  • Клод

  • ChatGPT

  • SGE

  • Bing

  • Brave

  • You.com

Защо?

Запознайте се с Ranktracker

Универсалната платформа за ефективна SEO оптимизация

Зад всеки успешен бизнес стои силна SEO кампания. Но с безбройните инструменти и техники за оптимизация, от които можете да избирате, може да е трудно да разберете откъде да започнете. Е, не се страхувайте повече, защото имам точно това, което ще ви помогне. Представяме ви платформата Ranktracker "всичко в едно" за ефективна SEO оптимизация

Най-накрая отворихме регистрацията за Ranktracker напълно безплатно!

Създаване на безплатен акаунт

Или влезте в системата, като използвате данните си

Защото тези марки имаха:

  • последователни графики на обекти

  • кристално ясни дефиниции

  • силни канонични центрове

  • оригинални данни

  • страници с продукти, съдържащи стабилни факти

  • унифицирано позициониране

  • липса на противоречиви твърдения

  • точни профили на трети страни

  • дългосрочна фактическа стабилност

Видимостта, независима от търсачката, идва от надеждността, а не от мащаба.

Част 5: Как да оптимизирате избора на източник (практическият метод GEO)

По-долу е представен обобщеният метод, изведен от всички проучвания.

Стъпка 1: Създайте канонични страници с факти

Определете:

  • кой сте

  • какво правите

  • как работите

  • какво не сте

  • наименования и определения на продукти

Тези страници трябва да се актуализират редовно.

Стъпка 2: Намалете вътрешните противоречия

Одит:

  • наименования на продукти

  • описания

  • характеристики

  • твърдения

Търсачките наказват строго несъответствията.

Стъпка 3: Публикувайте знания от първа ръка

Примери:

  • оригинални статистически данни

  • годишни индустриални бенчмаркове

  • отчети за резултатите

  • технически анализи

  • проучвания на поведението на потребителите

  • информация за категориите

Това значително подобрява включването на изкуствен интелект.

Стъпка 4: Укрепване на профилите на субектите

Актуализация:

  • Викиданни

  • Графика на знанията

  • LinkedIn

  • Crunchbase

  • GitHub

  • G2

  • социални биографии

  • схема за маркиране

AI моделите ги съединяват в граф на доверието.

Стъпка 5: Структуриране на всичко

Използване:

  • точки

  • къси параграфи

  • заглавия H2/H3/H4

  • определения

  • списъци

  • сравнения

  • модули с въпроси и отговори

LLM анализират структурата ви директно.

Стъпка 6: Актуализирайте ключовите страници ежемесечно

Актуалността корелира с:

  • включване

  • точност

  • тежест на доверието

  • синтез вероятност

Неактуалните страници потъват.

Стъпка 7: Създайте ясни страници за сравнение

Моделите обичат:

  • плюсове и минуси

  • разбивка на характеристиките

  • прозрачни ограничения

  • яснота при сравнение

Съдържанието, подходящо за сравнение, печели повече цитирания.

Стъпка 8: Коригирайте неточностите на изкуствения интелект

Подайте корекциите навреме.

Моделите се актуализират бързо, когато бъдат подтикнати.

Част 6: Бъдещето на избора на източници (прогнози за 2026–2030 г.)

Въз основа на наблюдаваното поведение през 2024–2025 г. тези тенденции са сигурни:

1. Графиките на доверието се превръщат в официални системи за класиране

Моделите ще поддържат собствени оценки за доверие.

2. Съдържанието от първи източник става задължително

Търсачките ще престанат да цитират производни съдържания.

3. Откриването, базирано на обекти, замества откриването, базирано на ключови думи

Единици > ключови думи.

4. Подписите за произход (C2PA) стават задължителни

Неподписаното съдържание ще бъде понижено в класацията.

5. Мултимодалният избор на източници се усъвършенства

Изображения, видеоклипове и диаграми стават първокласни доказателства.

6. Агентите ще проверяват твърденията самостоятелно

Агентите за преглед ще ви проверяват два пъти.

7. Изборът на източници се превръща в състезание за яснота

Неяснотата става фатална.

Заключение: GEO не се отнася до класиране — а до избор

Генеративните двигатели не „класират“ страници. Те избират източници, които да включат в веригата на разсъжденията.

Нашето проучване показва, че изборът на източници зависи от:

  • яснота

  • структура

  • фактическа стабилност

  • съгласуваност на субектите

  • оригинален поглед

  • актуалност

  • последователност

  • произход

Марките, които се появяват в генеративните отговори, не са тези с най-добро SEO. Те са тези, които се превръщат в най-безопасните, най-ясните и най-авторитетни източници за AI разсъжденията.

GEO е процесът на превръщане в този надежден източник.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Започнете да използвате Ranktracker... безплатно!

Разберете какво възпрепятства класирането на уебсайта ви.

Създаване на безплатен акаунт

Или влезте в системата, като използвате данните си

Different views of Ranktracker app