Glossario SEO / Indicizzazione

Indicizzazione

Che cos'è l'indicizzazione?

L'indicizzazione è la capacità di una pagina web di essere indicizzata dai motori di ricerca. Solo le pagine indicizzabili possono comparire nei risultati di ricerca.

Per indicizzare una pagina web, i motori di ricerca, come Google, devono:

  • Scoprire l'URL della pagina
  • Crawl (scaricare il contenuto)
  • Elaborazione (comprendere ed estrarre le informazioni chiave dalle pagine crawlate)

Solo allora la pagina potrà apparire nei risultati di ricerca.

Se i web crawler non riescono a fare il loro lavoro e a scansionare una pagina del vostro sito, questa non può essere indicizzata in modo appropriato. Senza indicizzazione, la pagina del vostro sito web non può portare traffico di ricerca perché rimarrà invisibile ai motori di ricerca.

Perché l'indicizzazione è importante?

L'indicizzazione consente ai motori di ricerca di visualizzare le pagine del vostro sito web nelle SERP. Senza indicizzazione, non è possibile ottenere traffico di ricerca organico verso il vostro sito.

A volte è più sensato rendere alcune pagine non indicizzabili. Ad esempio, le pagine non indicizzabili sono da preferire quando si tratta di landing page, pagine di bassa qualità o pagine "Grazie per l'iscrizione". Dopo tutto, non si vuole che queste pagine appaiano nei risultati di ricerca.

Tuttavia, se si vuole che gli URL si classifichino, è necessario assicurarsi che le pagine siano sia crawlabili che indicizzabili.

Cosa rende una pagina indicizzabile?

Per essere considerata "indicizzabile", la pagina deve soddisfare i seguenti criteri:

1. La pagina deve essere crawlabile

Affinché una pagina web venga indicizzata, i crawler dei motori di ricerca devono essere in grado di accedere al suo contenuto e di effettuarne il crawling. Un elemento che influisce direttamente sulla "crawlabilità" di una pagina web è il file robots.txt.

Il file robots.txt è un piccolo file che si trova nella directory principale del sito web. Il suo ruolo è quello di fornire istruzioni ai web crawler e indicare loro quali pagine del sito non devono essere carrellate. In caso contrario, i bot effettueranno il crawling di tutte le pagine del sito web che riescono a trovare; lo fanno per impostazione predefinita.

Ci sono casi in cui l'imposizione di tali "restrizioni" ha senso. Tuttavia, è essenziale assicurarsi di non bloccare inconsapevolmente le pagine che si desidera indicizzare.

2. La pagina non deve avere un tag "Noindex".

Il tag "noindex" è una direttiva di pagina che indica al motore di ricerca di non indicizzare una pagina specifica. In pratica, impedisce a una pagina di apparire nelle SERP.

A volte è consigliabile "non indicizzare" alcune pagine, come le landing page, le pagine di login, le pagine di scarsa qualità o le pagine di ringraziamento, e mantenerle "private".

Tuttavia, se si fa un uso improprio o, ad esempio, si dimentica di rimuovere questa direttiva dalla pagina che si vuole indicizzare, si perderà traffico di ricerca organico.

È possibile effettuare il crawling del sito web con lo strumento Site Audit di Ranktracker per assicurarsi che nessuna delle pagine che si desidera indicizzare abbia il tag "noindex".

3. La pagina deve essere canonica

Un tag canonico (rel="canonical") nel codice di una pagina definisce la versione principale per le pagine duplicate, quasi duplicate e simili. Ciò significa che solo le pagine canoniche possono essere indicizzate, mentre le loro versioni non canoniche saranno escluse.

A meno che non si aggiunga il tag canonical a una pagina, Google si baserà su segnali come i backlink interni ed esterni, la sitemap XML e i reindirizzamenti per decidere quale URL "rappresenterà" quel cluster nel suo indice.

Ciò significa che se volete che la vostra pagina appaia nei risultati di ricerca, non deve dichiarare nessun'altra pagina come sua versione canonica. Una buona pratica SEO consiste nell'avere tag canonici autoreferenziali per le pagine indicizzabili.

Come aiutare Google a indicizzare la vostra pagina

Ecco cosa potete fare per aiutare Google a indicizzare le pagine del vostro sito:

1. Presentare le sitemap a Google

Una sitemap è essenzialmente un elenco (in genere in formato XML) contenente tutte le pagine del vostro sito web.

La sitemap ha il compito di indicare a Google le pagine che volete siano indicizzate sul vostro sito.

Prima di inviare una sitemap, verificate che rifletta lo stato attuale del vostro sito web e correggete eventuali errori, come link interrotti, pagine orfane e simili.

È possibile inviare le sitemap a Google utilizzando la Google Search Console.

2. Invia le singole pagine attraverso lo strumento di ispezione degli URL

Se si desidera richiedere l'indicizzazione o la reindicizzazione di alcuni singoli URL, è possibile utilizzare lo strumento di ispezione degli URL in Google Search Console.

Lo strumento di ispezione degli URL è uno strumento di diagnostica che si trova nella Google Search Console e che offre una visione della versione indicizzata da Google della vostra pagina web e consente, tra l'altro, di testare gli URL dal vivo e di visualizzare la versione renderizzata della pagina.

Consente inoltre di inviare singole pagine a Google.

Se si desidera richiedere l'indicizzazione di un nuovo URL o il re-crawling e la reindicizzazione di URL aggiornati, è possibile indicare a Google di farlo selezionando il pulsante "Richiedi indicizzazione". Se non ci sono errori nel vostro URL live, Google aggiungerà la vostra pagina alla sua coda di crawling.

Si noti però che c'è un limite al numero di URL che si possono richiedere per l'indicizzazione al giorno.

3. Fornire collegamenti interni per una migliore/più rapida reperibilità

Un altro modo per favorire il crawling e, di conseguenza, accelerare l'indicizzazione del sito web è quello di utilizzare il linking interno.

Quando esplorano Internet, i crawler di Google seguono un percorso formato da link. Pertanto, quando una pagina del vostro sito web rimanda a un'altra, i crawler seguiranno il percorso esistente e scopriranno nuovi contenuti.

Le pagine prive di collegamenti interni sono chiamate "pagine orfane".

Per questo motivo è fondamentale assicurarsi che siano presenti collegamenti interni da e verso le pagine più importanti. Certo, questo avviene naturalmente quando si crea un sito ben organizzato.

Tuttavia, non è male verificare se sul vostro sito web ci sono pagine orfane, ovvero pagine che non hanno link interni che puntano ad esse. Potete farlo con lo strumento Site Audit di Ranktracker.

A questo proposito, è necessario assicurarsi che questi link interni che puntano a pagine indicizzabili non abbiano il tag "nofollow", perché Google non effettua il crawling dei link nofollow.

Domande frequenti

Qual è il ruolo del file Robots.txt nell'indicizzazione?

Il file robots.txt fornisce istruzioni ai web crawler su quali pagine o sezioni del vostro sito non devono essere scansionate, con un impatto sulla crawlabilità e, di conseguenza, sull'indicizzazione delle vostre pagine.

Come posso verificare se le mie pagine sono indicizzate?

È possibile verificare se le pagine sono indicizzate utilizzando Google Search Console. Lo strumento fornisce informazioni sullo stato di indicizzazione dei vostri URL.

Qual è l'impatto delle pagine orfane sull'indicizzazione?

Le pagine orfane, che non hanno collegamenti interni che puntano a loro, hanno meno probabilità di essere scoperte e indicizzate dai motori di ricerca. Assicurarsi che tutte le pagine importanti siano ben collegate all'interno del sito ne migliora l'indicizzazione.

Assicurandovi che le vostre pagine siano crawlabili, prive di tag "noindex" e correttamente canonicalizzate, potete migliorare le loro possibilità di essere indicizzate e di apparire nei risultati dei motori di ricerca. Controlli regolari e link interni strategici possono favorire ulteriormente questo obiettivo.