Il Nemico del Regno: Contenuto Duplicato
Il Giovane fissava lo schermo con un leggero disagio. Due pagine, stesso argomento, parole diverse… ma non troppo. Entrambe ben scritte. Entrambe ottimizzate.
Giovane: «Se due contenuti sono simili, Google li penalizza?»
Galdor (avvicinandosi lentamente): «Google non punisce come credi — il Guardiano delle Reti sceglie. E quando sceglie, tutto ciò che non viene scelto… svanisce.»
Giovane (sgranando gli occhi): «Quindi il contenuto duplicato non è una penalità?»
Galdor: «No — è ben peggio: è confusione. Quando esistono più versioni simili dello stesso contenuto, Google e l’AI devono decidere quale sia la voce autentica. Se non glielo dici tu, lo farà lui — e raramente sceglie come speri.»
Galdor: «Quando due pagine rispondono allo stesso intento, trattano le stesse entità, coprono lo stesso perimetro semantico — non si rafforzano ma si dividono. Link, segnali, autorevolezza… si spezzano.»
Galdor: «Gestire il contenuto duplicato non è un trucco SEO, ma un atto di chiarezza verso Google, l’AI e chi legge. Ogni pagina deve avere una voce unica, coerente e riconoscibile. Il resto… si perde nel rumore della rete.»
Il sistema di gestione del contenuto duplicato di Google utilizza un processo di canonicalizzazione: quando rileva più versioni simili, seleziona quella che ritiene più autorevole e pertinente e la usa come riferimento per il ranking.
Gli algoritmi Panda e i successivi aggiornamenti del Core Algorithm valutano negativamente i siti con alta percentuale di contenuto duplicato o con scarsa unicità semantica.
Rilevanza per AI Search
- Google AI Overview: l'AI rileva immediatamente contenuti semanticamente equivalenti e seleziona la versione considerata più autorevole. Il canonical è fondamentale per indicare quale versione citare.
- Perplexity / ChatGPT Search: i LLM riconoscono pattern di contenuto duplicato e tendono a citare un'unica fonte autorevole piuttosto che più versioni dello stesso contenuto.
- GEO: mantenere un'unica voce autorevole per ogni argomento — con canonical correttamente configurato — è essenziale per concentrare i segnali di autorevolezza e massimizzare la probabilità di citazione AI.
Il duplicate content non comporta penalizzazioni automatiche, ma la presenza di più versioni simili induce i sistemi di ranking a selezionare una sola versione principale — provocando la dispersione dei segnali SEO.
Strumenti per gestire il contenuto duplicato:
- Tag canonical: indica la versione principale
<link rel="canonical" href="https://www.esempio.com/pagina-principale" />
- Hreflang: per contenuti multilingua (non sono duplicati se correttamente dichiarati)
- Consolidamento: unire pagine simili in una risorsa unica più completa
- Redirect 301: per pagine duplicate da eliminare
Due tipi di duplicato:
- Interno: articoli dello stesso sito che trattano lo stesso tema — diluisce autorevolezza
- Esterno: quando altri siti copiano o si viene copiati — perdita di riconoscimento
| Scenario | Soluzione | Priorità |
|---|---|---|
| Stesso prodotto in più categorie | Tag canonical sulla versione principale | Alta |
| Pagine www e non-www | Redirect 301 + canonical | Alta |
| Contenuti simili sullo stesso tema | Consolidare in una pagina più completa | Alta |
| Contenuti tradotti (IT/EN) | Hreflang correttamente configurato | Media |
| Parametri URL (es. ?sort=price) | Canonical o noindex sui parametri | Media |
| Contenuto copiato da terzi | DMCA Takedown, monitoring con Copyscape | Variabile |
Amar Amoretti lavora su internet — un posto vasto, complicato e pieno di cose che probabilmente ti stai perdendo. Ha realizzato yaoki.academy con l'obiettivo dichiarato di rendere la SEO/GEO o come diavolo volete chiamarla comprensibile agli esseri umani. Questo è considerato da molti un atto di ottimismo cosmico.