Introdução
Um vazamento maciço de documentação interna de classificação da Pesquisa Google causou um choque na comunidade de SEO. O vazamento, que expôs mais de 14.000 recursos de classificação em potencial, oferece uma visão sem precedentes dos bastidores do sistema de classificação de pesquisa do Google, que é muito bem guardado.
A história por trás do vazamento
Erfan Azimi compartilhou o vazamento de um documento da API do Google com Rand Fishkin, do SparkToro, que então recrutou Michael King, do iPullRank, para ajudar a disseminar as informações. Os arquivos vazados, originários de um commit de documento da API do Google intitulado "yoshi-code-bot /elixer-google-api", não foram resultado de um hack ou de um denunciante, mas sim de uma liberação de documento interno.
Visão geral do vazamento
O vazamento fornece uma visão abrangente dos fatores de classificação do Google, revelando insights sobre variações do PageRank, métricas de autoridade do site e muito mais. Aqui está uma análise detalhada:
Principais insights sobre o vazamento de documentos da Pesquisa Google
PageRank e suas variações
-
PageRank_NS: agora obsoleto, esse algoritmo está associado à compreensão de documentos e modifica o PageRank tradicional para se concentrar em um subconjunto localizado da rede em torno dos nós de semente.
-
Sete tipos de PageRank: O Google menciona sete tipos diferentes de PageRank, incluindo o famoso ToolBarPageRank. Essas variações indicam que o Google emprega vários métodos para avaliar a importância da página.
Identificação do modelo de negócios
O algoritmo do Google pode identificar vários modelos de negócios, incluindo sites de notícias, sites YMYL (Your Money or Your Life), blogs pessoais, comércio eletrônico e sites de vídeo. O motivo por trás da filtragem específica de blogs pessoais ainda não está claro e levanta questões sobre as intenções mais amplas do Google.
Componentes do algoritmo
-
NavBoost: Um mecanismo de reclassificação baseado no comportamento do usuário e nos registros de cliques, fortemente influenciado pelos dados do Chrome.
-
NSR (Normalized Site Rank): Usado para calcular a classificação do site para pedaços de sites em nível de host.
-
ChardScores: Pontuações no nível do site que preveem a qualidade do site/página com base no conteúdo.
Métricas de autoridade do site
O Google usa uma métrica de autoridade em todo o site e vários sinais, incluindo o tráfego dos navegadores Chrome, para avaliar a autoridade do site. Isso sugere que a qualidade e a credibilidade gerais do site desempenham papéis significativos na classificação.
Técnicas de incorporação e autoridade do tópico
-
Incorporações de páginas e sites: O Google emprega incorporações de página, incorporações de site, foco do site e raio do site em sua função de pontuação para entender a relevância tópica e a consistência do conteúdo de um site.
-
Bordas do tópico e autoridade do tópico: Métricas como siteFocusScore, siteRadius, siteEmbeddings e pageEmbeddings são usadas para medir a autoridade do tópico, enfatizando a importância de manter um foco claro no tópico.
Dados de cliques e envolvimento do usuário
-
NavBoost: O NavBoost se baseia em dados de cliques e no comportamento do usuário para classificar novamente os resultados de pesquisa, ressaltando a importância das métricas de envolvimento do usuário.
-
Métricas de cliques: O Google mede vários tipos de cliques, incluindo cliques ruins, cliques bons, últimos cliques mais longos e impressões em todo o site.
Insights sobre dados de qualidade NSR
Os principais fatores de pontuação do documento de dados NSR incluem:
-
titlematchScore: Uma pontuação de correspondência de título em todo o site que indica o nível de correspondência dos títulos com as consultas dos usuários.
-
site2vecEmbedding: Um vetor de todo o site semelhante ao word2vec, destacando a importância de incorporações abrangentes do site.
-
pnavClicks: Provavelmente relacionado a informações de navegação derivadas de dados de cliques do usuário.
-
chromeInTotal: visualizações do Chrome em todo o site, enfatizando a importância dos sinais em todo o site.
-
chardVariance e chardScoreVariance: Pontuações que preveem a qualidade do site/página com base no conteúdo, sendo a consistência fundamental.
Conclusões práticas para profissionais de SEO
-
Invista em um site bem projetado: Certifique-se de que o seu site tenha uma arquitetura intuitiva para otimizar o NavBoost, que se baseia no comportamento do usuário e nos registros de cliques para reclassificar os resultados de pesquisa.
-
Remover/bloquear páginas topicamente irrelevantes: Remova ou bloqueie páginas que não sejam relevantes em termos de tópico. Estabeleça seu tópico-alvo e garanta que cada página tenha uma boa pontuação nessa área.
-
Otimize os títulos e o conteúdo: Otimize os títulos em torno das consultas e garanta que os parágrafos respondam claramente a essas consultas para melhorar a incorporação e a relevância da página.
-
Concentre-se em cliques e impressões: Escreva conteúdo que atraia mais impressões e cliques, enfatizando o envolvimento do usuário.
-
Atualize o conteúdo regularmente: Atualize regularmente o conteúdo com informações exclusivas, novas imagens e vídeos para manter o frescor e obter uma pontuação alta nos cálculos de esforço.
-
Mantenha um conteúdo de alta qualidade: A consistência do conteúdo de alta qualidade é fundamental. As pontuações chard em nível de site do Google preveem a qualidade do site/página com base no conteúdo.
-
Valorizar o crescimento das impressões: O aumento das impressões é um sinal positivo do desempenho do site.
-
Otimizar a saliência da entidade: Concentre-se em melhorar as pontuações de saliência das entidades e a identificação das principais entidades, conforme mencionado no vazamento.
-
Remover páginas com desempenho ruim: Identifique e elimine páginas com métricas de usuário ruins e sem backlinks para manter pontuações altas em todo o site.
Como remover a memória do Google de uma versão antiga de um documento
De acordo com o vazamento, o Google mantém um registro de todas as versões de uma página da Web, mantendo um arquivo interno da Web semelhante ao Wayback Machine. No entanto, o Google usa apenas as últimas 20 versões de um documento. Se você atualizar uma página, aguardar um rastreamento e repetir o processo 20 vezes, poderá efetivamente eliminar determinadas versões da página. Essa tática pode ser útil para melhorar os pesos históricos e as pontuações associadas a versões mais antigas.
Sistema de classificação da pesquisa do Google
Uma conjectura interessante do vazamento é o impacto do peso do termo (tamanho literal). Colocar palavras em negrito ou ajustar o tamanho das palavras pode influenciar as pontuações dos documentos. Além disso, os mecanismos de armazenamento do índice do Google priorizam o conteúdo de forma diferente:
-
Unidades Flash: Para o conteúdo mais importante e atualizado regularmente.
-
Unidades de estado sólido: Para conteúdo menos importante.
-
Discos rígidos padrão: Para conteúdo atualizado irregularmente.
Indexador do Google: Alexandria
O indexador do Google chama-se Alexandria, em homenagem à famosa biblioteca. Outros indexadores mencionados incluem o SegIndexer, que coloca os documentos em camadas, e o TeraGoogle, que lida com o armazenamento de memória de longo prazo.
Seed Sites e autoridade em todo o site
O vazamento menciona um fator chamado isElectionAuthority, possivelmente indicando sites semente ou autoridades de tópicos. Isso sugere que sites com alta autoridade, como aqueles com um PageRank de 9/10, têm influência significativa. No entanto, o nsrIsElectionAuthority é considerado obsoleto, deixando alguma ambiguidade na interpretação.
Conteúdo curto pode ser classificado
Ao contrário da crença comum, conteúdo curto não é igual a conteúdo pobre. O vazamento confirma que o conteúdo curto pode ser bem classificado, embora com um sistema de pontuação diferente.
Links novos vs. links existentes
De acordo com o multiplicador de valor de link do freshdocs, os links de páginas da Web mais recentes são mais valiosos do que aqueles inseridos em conteúdo mais antigo. Isso indica que, embora as edições de nicho possam ser eficazes, os links novos têm um impacto maior.
Descobertas favoritas
Qualidade da página (PQ)
O Google usa um LLM para estimar o "esforço" das páginas de artigos, ajudando a determinar se uma página pode ser facilmente replicada. Ferramentas, imagens, vídeos, informações exclusivas e profundidade de informações são maneiras de obter uma pontuação alta nos cálculos de esforço.
Fronteiras de tópicos e autoridade de tópicos
A autoridade tópica, apoiada pelo siteFocusScore, siteRadius, siteEmbeddings e pageEmbeddings, é fundamental. Manter um foco tópico claro e minimizar o desvio do tópico ajuda a melhorar as classificações.
Qualidade da imagem
ImageQualityClickSignals mede a qualidade da imagem com base em dados de cliques (utilidade, apresentação, atratividade, envolvimento).
Host NSR
Host NSR é a classificação do site calculada para partes do site em nível de host, medindo a qualidade em segmentos. Esse sistema de divisão em pedaços ajuda o Google a avaliar a qualidade do site de forma abrangente.
Teoria unificada de classificação
Esta seção tenta consolidar os fatores do vazamento em uma fórmula matemática, destacando várias métricas e seus impactos na pontuação geral da classificação ®.
Definições e métricas
Pontuações de interação do usuário (UIS):
-
UgcScore: Envolvimento com conteúdo gerado pelo usuário.
-
TitleMatchScore: Relevância dos títulos para as consultas dos usuários.
-
ChromeInTotal: Total de interações rastreadas via Chrome.
-
SiteImpressions: Total de impressões no site.
-
TopicImpressions: Impressões em páginas de tópicos específicos.
-
SiteClicks: Taxa de cliques do site.
-
TopicClicks: Taxa de cliques para páginas de tópicos específicos.
Índices de qualidade de conteúdo (CQS):
-
ImageQualityClickSignals: Sinais de qualidade de cliques em imagens.
-
VideoScore: Qualidade e engajamento do conteúdo de vídeo.
-
ShoppingScore: Pontuação para conteúdo relacionado a compras.
-
PageEmbedding: Incorporação semântica do conteúdo da página.
-
SiteEmbedding: Incorporação semântica do conteúdo do site.
-
SiteRadius: Medida de desvio dentro da incorporação do site.
-
SiteFocus: Métrica que indica o foco do tópico.
-
TextConfidence: Confiança na relevância e na qualidade do texto.
-
EffortScore: Esforço e qualidade na criação de conteúdo.
Pontuação de links (LS):
-
TrustedAnchors: Qualidade e confiabilidade dos links de entrada.
-
SiteLinkIn: Valor médio dos links de entrada.
-
PageRank: Diversas pontuações do PageRank (0, 1, 2, ToolBar, NR).
Reforço de relevância (RB):
-
TopicEmbedding: Relevância ao longo do tempo.
-
QnA: Medida de qualidade da linha de base.
-
STS: Pontuação agregada com base na compreensão do texto, saliência e entidades.
Aumento de qualidade (QB):
-
SAS: pontuação de autoridade do site relacionada à confiança, confiabilidade e autoridade do link.
-
EFTS: Pontuação de esforço que incorpora texto, multimídia e comentários.
-
FS: Pontuação de atualização com base nas datas de atualização e postagem original.
-
CSA: Ajustes específicos de conteúdo com base em SERP e recursos na página.
Ajustes específicos de conteúdo (CSA):
-
CDS: pontuação de dados do Chrome com foco em impressões e cliques no site.
-
SDS: pontuação de rebaixamento da SERP com base na medição da experiência da SERP.
-
EQSS: Pontuação experimental Q Star para variáveis experimentais.
Fórmula completa
R=(∑i=17wi⋅UISi)+(∑i=19vi⋅CQSi)+(∑i=13xi⋅LSi)×(RB+QB+X)-
R=((w1⋅UgcScore+w2⋅TitleMatchScore+w3⋅ChromeInTotal+w4⋅SiteImpressions+w5⋅TopicImpressions+w6⋅SiteClicks+w7⋅TopicClicks)+(v1⋅ImageQualityClickSignals+v2⋅VideoScore+v3⋅ShoppingScore+v4⋅PageEmbedding+v5⋅SiteEmbedding+v6⋅SiteRadius+v7⋅SiteFocus+v8⋅TextConfidence+v9⋅EffortScore)+(x1⋅TrustedAnchors+x2⋅SiteLinkIn+x3⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1⋅CDS+y2⋅SDS+y3⋅EQSS)
Visão geral da pontuação generalizada
1. Envolvimento do usuário:
- UgcScore, TitleMatchScore, ChromeInTotal, SiteImpressions, Topic Impressions, Site Clicks, Topic Clicks
2. Pontuações de multimídia:
- ImageQualityClickSignals, VideoScore, ShoppingScore
3. Links:
- TrustedAnchors, SiteLinkIn (valor médio dos links de entrada), PageRank (0, 1, 2, ToolBar, NR)
4. Compreensão do conteúdo:
- PageEmbedding, SiteEmbedding, SiteRadius, SiteFocus, TextConfidence, EffortScore
Conclusão
O vazamento da documentação fornece insights valiosos sobre os mecanismos de classificação do Google, desmascarando vários mitos e revelando fatores intrincados que influenciam os resultados de pesquisa. Os profissionais de SEO podem aproveitar esse conhecimento para refinar suas estratégias, concentrando-se no envolvimento do usuário, na relevância do tópico e na qualidade consistente do conteúdo. À medida que a comunidade de SEO digere essas revelações, muitos provavelmente reconsiderarão suas abordagens à luz dessas novas informações.
Ao compreender e aplicar esses insights, os profissionais de SEO podem navegar melhor pelas complexidades do sistema de classificação do Google, melhorando a visibilidade e o desempenho de seus sites nos resultados de pesquisa.