• LLM

Come i laureati in Lettere imparano, dimenticano e aggiornano le conoscenze

  • Felix Rose-Collins
  • 6 min read

Introduzione

I modelli linguistici di grandi dimensioni sembrano sistemi viventi. Imparano, si adattano, incorporano nuove informazioni e, a volte, dimenticano.

Ma sotto il cofano, la loro "memoria" funziona in modo molto diverso dalla memoria umana. Gli LLM non memorizzano fatti. Non ricordano i siti web. Non indicizzano i contenuti come fa Google. La loro conoscenza emerge invece dai modelli appresi durante l'addestramento, dal modo in cui gli embedding cambiano durante gli aggiornamenti e dal modo in cui i sistemi di recupero forniscono loro nuove informazioni.

Per la SEO, l'AIO e la visibilità generativa, è fondamentale comprendere come gli LLM apprendono, dimenticano e aggiornano le conoscenze. Perché ognuno di questi meccanismi influenza:

  • se il tuo marchio compare nelle risposte dell'IA

  • se i tuoi vecchi contenuti influenzano ancora i modelli

  • con quale rapidità i modelli incorporano le tue nuove informazioni

  • se le informazioni obsolete continuano a riapparire

  • come la ricerca basata su LLM sceglie quali fonti citare

Questa guida spiega esattamente come funziona la memoria degli LLM e cosa devono fare le aziende per rimanere visibili nell'era dell'IA in continuo aggiornamento.

1. Come imparano gli LLM: i tre livelli di formazione della conoscenza

Gli LLM apprendono attraverso un processo a livelli:

  1. Formazione di base

  2. Messa a punto (SFT/RLHF)

  3. Recupero (RAG/Live Search)

Ogni livello influisce in modo diverso sulla "conoscenza".

Livello 1: Formazione di base (apprendimento dei modelli)

Durante la formazione di base, il modello apprende da:

  • corpora di testo di grandi dimensioni

  • set di dati curati

  • libri, articoli, codice

  • enciclopedie

  • fonti pubbliche e con licenza di alta qualità

Ma è importante sottolineare che:

L'addestramento di base non memorizza fatti.

Memorizza modelli relativi alla struttura del linguaggio, della logica e della conoscenza.

Il modello apprende cose come:

  • cos'è Ranktracker (se lo ha visto)

  • come la SEO si relaziona ai motori di ricerca

  • cosa fa un LLM

  • come si combinano le frasi

  • cosa si intende per spiegazione affidabile

La "conoscenza" del modello è codificata in trilioni di parametri: una compressione statistica di tutto ciò che ha visto.

L'addestramento di base è lento, costoso e poco frequente.

Questo è il motivo per cui i modelli hanno dei limiti di conoscenza.

Ed è per questo che i nuovi fatti (ad esempio, nuove funzionalità di Ranktracker, eventi del settore, lanci di prodotti, aggiornamenti degli algoritmi) non appariranno fino a quando non verrà addestrato un nuovo modello di base, a meno che un altro meccanismo non lo aggiorni.

Livello 2: Messa a punto (apprendimento comportamentale)

Dopo l'addestramento di base, i modelli vengono sottoposti a una messa a punto:

  • messa a punto supervisionata (SFT)

  • Apprendimento rinforzato dal feedback umano (RLHF)

  • AI costituzionale (per modelli antropici)

  • messa a punto della sicurezza

  • messa a punto specifica per dominio

Questi livelli insegnano al modello:

  • tono da utilizzare

  • come seguire le istruzioni

  • come evitare contenuti dannosi

  • come strutturare le spiegazioni

  • come ragionare passo dopo passo

  • come dare priorità alle informazioni affidabili

La messa a punto NON aggiunge conoscenze fattuali.

Aggiunge regole comportamentali.

Il modello non imparerà che Ranktracker ha lanciato una nuova funzionalità, ma imparerà come rispondere in modo educato o come citare meglio le fonti.

Livello 3: Recupero (conoscenza in tempo reale)

Questa è la svolta del 2024-2025:

Incontrare Ranktracker

La piattaforma all-in-one per un SEO efficace

Dietro ogni azienda di successo c'è una forte campagna SEO. Ma con innumerevoli strumenti e tecniche di ottimizzazione tra cui scegliere, può essere difficile sapere da dove iniziare. Ebbene, non temete più, perché ho quello che fa per voi. Vi presento la piattaforma Ranktracker all-in-one per una SEO efficace.

Abbiamo finalmente aperto la registrazione a Ranktracker in modo assolutamente gratuito!

Creare un account gratuito

Oppure accedi con le tue credenziali

RAG (Retrieval-Augmented Generation)

I modelli moderni integrano:

  • ricerca in tempo reale (ChatGPT Search, Gemini, Perplexity)

  • banche dati vettoriali

  • recupero a livello di documento

  • grafici di conoscenza interni

  • fonti di dati proprietarie

RAG consente agli LLM di accedere a:

  • fatti più recenti rispetto alla data limite di addestramento

  • notizie recenti

  • statistiche aggiornate

  • contenuti attuali del tuo sito web

  • pagine dei prodotti aggiornate

Questo livello è ciò che rende l'IA aggiornata, anche se il modello di base non lo è.

Il recupero è l'unico livello che si aggiorna istantaneamente.

Ecco perché l'AIO (ottimizzazione dell'IA) è così importante:

È necessario strutturare i contenuti in modo che i sistemi di recupero LLM possano leggerli, considerarli affidabili e riutilizzarli.

2. Come gli LLM "dimenticano"

Gli LLM dimenticano in tre modi diversi:

  1. Sovrascrittura dei parametri Dimenticanza

  2. Ricerca sparsa Dimenticare

  3. Dimenticanza della sovrascrittura del consenso

Ciascuno di essi è importante per la SEO e la presenza del marchio.

1. Dimenticare la sovrascrittura dei parametri

Quando un modello viene riaddestrato o ottimizzato, i vecchi modelli possono essere sovrascritti da quelli nuovi.

Questo accade quando:

  • un modello viene aggiornato con nuovi dati

  • una messa a punto sposta gli embedding

  • La messa a punto di sicurezza sopprime determinati modelli

  • vengono introdotti nuovi dati di dominio

Se il tuo marchio era marginale durante l'addestramento, gli aggiornamenti successivi possono spingere il tuo embedding ancora più nell'oscurità.

Ecco perché la coerenza dell'entità è importante.

I marchi deboli e incoerenti vengono sovrascritti facilmente. I contenuti forti e autorevoli creano incorporamenti stabili.

2. Recupero sparso Dimenticare

I modelli che utilizzano il recupero hanno sistemi di classificazione interni per:

  • quali domini sembrano affidabili

  • quali pagine sono più facili da analizzare

  • quali fonti corrispondono alla semantica della query

Se il tuo contenuto è:

  • non strutturato

  • non aggiornati

  • incoerente

  • semanticamente deboli

  • collegate in modo inadeguato

...diventa meno probabile che vengano recuperati nel tempo, anche se i fatti sono ancora corretti.

Gli LLM ti dimenticano perché i loro sistemi di recupero smettono di selezionarti.

Il Web Audit e il Backlink Monitor di Ranktracker aiutano a stabilizzare questo livello aumentando i segnali di autorità e migliorando la leggibilità da parte delle macchine.

3. Sovrascrittura del consenso Dimenticare

Gli LLM si basano sul consenso della maggioranza sia durante l'addestramento che durante l'inferenza.

Se Internet cambia idea (ad esempio, nuove definizioni, statistiche aggiornate, best practice riviste), i tuoi contenuti più vecchi vanno contro il consenso e i modelli li "dimenticano" automaticamente.

Consenso > informazioni storiche

Gli LLM non conservano i fatti obsoleti. Li sostituiscono con modelli dominanti.

Ecco perché mantenere aggiornati i tuoi contenuti è essenziale per l'AIO.

3. Come gli LLM aggiornano le conoscenze

Esistono quattro modi principali in cui gli LLM aggiornano le loro conoscenze.

1. Nuovo modello di base (il grande aggiornamento)

Questo è l'aggiornamento più potente, ma anche il meno frequente.

Incontrare Ranktracker

La piattaforma all-in-one per un SEO efficace

Dietro ogni azienda di successo c'è una forte campagna SEO. Ma con innumerevoli strumenti e tecniche di ottimizzazione tra cui scegliere, può essere difficile sapere da dove iniziare. Ebbene, non temete più, perché ho quello che fa per voi. Vi presento la piattaforma Ranktracker all-in-one per una SEO efficace.

Abbiamo finalmente aperto la registrazione a Ranktracker in modo assolutamente gratuito!

Creare un account gratuito

Oppure accedi con le tue credenziali

Esempio: GPT-4 → GPT-5, Gemini 1.0 → Gemini 2.0

Un nuovo modello include:

  • nuovi set di dati

  • nuovi modelli

  • nuove relazioni

  • nuove basi fattuali

  • migliori schemi di ragionamento

  • conoscenza aggiornata del mondo

Si tratta di un reset totale della rappresentazione interna del modello.

2. Ottimizzazione del dominio (conoscenze speciali)

Le aziende ottimizzano i modelli per:

  • competenza giuridica

  • settori medici

  • flussi di lavoro aziendali

  • banche dati di supporto

  • efficienza di codifica

Le ottimizzazioni modificano il comportamento E le rappresentazioni interne dei fatti specifici del dominio.

Se il tuo settore ha molti modelli ottimizzati (il SEO lo fa sempre di più), i tuoi contenuti influenzano anche quegli ecosistemi.

3. Livello di recupero (aggiornamento continuo)

Questo è il livello più rilevante per i professionisti del marketing.

Il recupero estrae:

  • i tuoi contenuti più recenti

  • i tuoi dati strutturati

  • le tue statistiche aggiornate

  • fatti corretti

  • nuove pagine dei prodotti

  • nuovi post sul blog

  • nuova documentazione

È la memoria in tempo reale dell'IA.

Ottimizzare per il recupero = ottimizzare per la visibilità dell'IA.

4. Aggiornamento dell'incorporamento / Aggiornamenti vettoriali

Ogni aggiornamento importante del modello ricalcola gli embedding. Questo cambia:

  • il posizionamento del tuo marchio

  • come i tuoi prodotti si relazionano agli argomenti

  • come sono raggruppati i tuoi contenuti

  • quali concorrenti sono più vicini nello spazio vettoriale

È possibile rafforzare la propria posizione attraverso:

  • coerenza dell'entità

  • backlink forti

  • definizioni chiare

  • cluster tematici

  • spiegazioni canoniche

Questo è il "vector SEO" ed è il futuro della visibilità generativa.

4. Perché è importante per SEO, AIO e ricerca generativa

Perché la scoperta dell'IA dipende da come gli LLM imparano, come dimenticano e come si aggiornano.

Se comprendi questi meccanismi, puoi influenzare:

  • ✔ se gli LLM recuperano i tuoi contenuti

  • ✔ se il tuo marchio è fortemente integrato

  • ✔ se le panoramiche dell'IA ti citano

  • ✔ se ChatGPT e Perplexity scelgono i tuoi URL

  • ✔ se i contenuti obsoleti continuano a danneggiare la tua autorevolezza

  • ✔ se i tuoi concorrenti dominano il panorama semantico

Questo è il futuro della SEO: non le classifiche, ma la rappresentazione nei sistemi di memoria dell'IA.

5. Strategie AIO in linea con l'apprendimento LLM

1. Rafforzare l'identità dell'entità

Denominazione coerente → incorporamenti stabili → memoria a lungo termine.

2. Pubblica spiegazioni canoniche

Le definizioni chiare sopravvivono alla compressione del modello.

3. Mantieni aggiornati i tuoi dati

Questo impedisce che il consenso venga sovrascritto dall'oblio.

4. Costruire cluster tematici profondi

I cluster formano forti vicinati vettoriali.

5. Migliorate i dati strutturati e lo schema

I sistemi di recupero preferiscono fonti strutturate.

6. Creare backlink autorevoli

Autorità = rilevanza = priorità di recupero.

7. Rimuovere le pagine contraddittorie o obsolete

L'incoerenza destabilizza gli embedding.

Gli strumenti di Ranktracker supportano ogni aspetto di questo processo:

  • SERP Checker → allineamento semantico ed entità

  • Audit web → leggibilità automatica

  • Backlink Checker → rafforzamento dell'autorità

  • Monitoraggioposizionamento → monitoraggio dell'impatto

  • AI Article Writer → contenuti in formato canonico

Considerazione finale:

Gli LLM non ti indicizzano, ti interpretano.

Incontrare Ranktracker

La piattaforma all-in-one per un SEO efficace

Dietro ogni azienda di successo c'è una forte campagna SEO. Ma con innumerevoli strumenti e tecniche di ottimizzazione tra cui scegliere, può essere difficile sapere da dove iniziare. Ebbene, non temete più, perché ho quello che fa per voi. Vi presento la piattaforma Ranktracker all-in-one per una SEO efficace.

Abbiamo finalmente aperto la registrazione a Ranktracker in modo assolutamente gratuito!

Creare un account gratuito

Oppure accedi con le tue credenziali

Comprendere come gli LLM apprendono, dimenticano e si aggiornano non è una questione accademica. È il fondamento della visibilità moderna.

Perché il futuro della SEO non riguarda più i motori di ricerca, ma la memoria dell'IA.

I marchi che avranno successo saranno quelli che capiranno:

  • come fornire segnali affidabili ai modelli

  • come mantenere la chiarezza semantica

  • come rafforzare gli embedding delle entità

  • come rimanere allineati con il consenso

  • come aggiornare i contenuti per il recupero dell'IA

  • come evitare di essere sovrascritti nella rappresentazione del modello

Nell'era della scoperta guidata dagli LLM:

la visibilità non è più una classifica, ma una memoria. E il tuo compito è rendere il tuo marchio indimenticabile.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Iniziate a usare Ranktracker... gratuitamente!

Scoprite cosa ostacola il posizionamento del vostro sito web.

Creare un account gratuito

Oppure accedi con le tue credenziali

Different views of Ranktracker app