16 giugno, 2017

La verità sui contenuti duplicati in un sito web (e perché non piacciono a Google)

Veronica Franceschin

condividi

Recentemente abbiamo avuto delle conversazioni interessanti con due dei nostri clienti sul tema dei contenuti duplicati, e ne abbiamo tratto alcune riflessioni che speriamo possano essere utili anche ad altri :)

Nel primo caso, un'azienda ci ha chiesto di adottare una strategia di pubblicazione sul proprio blog che prevedeva di fare un copia incolla dei post già pubblicati da un sito amico come se fossero propri, senza citare la fonte originale e senza nessuna modifica. Il motivo? Andavano già bene così.

Nel secondo caso, il cliente voleva alimentare in modo automatizzato il proprio blog “traendo spunto” dagli articoli provenienti da diverse testate di settore. In questo caso non avrebbe neanche dovuto esserci il lavoro manuale del “copiaincolla” perché la pubblicazione sarebbe dovuta avvenire automaticamente. Insomma, il blog perfetto ;)

Le due realtà cercavano entrambe un escamotage per risparmiare tempo e sfruttare testi già confezionati e di qualità. Senza la malizia di voler “rubare” qualcosa che portasse la firma di un altro, ma probabilmente con l’idea che se una cosa è “nell’internet” è di tutti e di nessuno.

E senza la consapevolezza che la duplicazione dei contenuti è una pratica che a Google non piace per niente…

Per questo abbiamo voluto fare un po’ chiarezza, iniziando dai concetti basilari.

 

Che cosa sono i contenuti duplicati?

I contenuti duplicati sono parti di testo copiate da altre pagine web che violano i diritti di chi li ha scritti e provocano la penalizzazione dei motori di ricerca.

Come afferma Google, sono da considerarsi contenuti duplicati “i blocchi di contenuto che appaiono molto simili o identici”, in pratica un testo non univoco presente su più pagine della rete. L’algoritmo che controlla la presenza di contenuti duplicati sul web è stato introdotto nel 2011 con il nome Google Panda: l’obiettivo principale è ripulire i risultati di ricerca dai siti di poco valore, favorendo quelli di alta qualità che curano i loro contenuti.

 

Perché Google penalizza la duplicazione dei contenuti?

L’obiettivo ultimo del motore di ricerca è offrire la migliore esperienza di navigazione possibile agli utenti con materiale aggiornato e interessante ed evitare pratiche fraudolente che mirino a migliorare il ranking senza esserselo “guadagnato”.

 

I casi possono essere due:

  1. Uno stesso sito che contiene al suo interno più pagine con contenuti identici tra di loro
  2. Due domini separati che pubblicano gli stessi contenuti

 

Contenuti duplicati all’interno di uno stesso sito

Vediamo il primo caso.


Se il nostro sito contiene pagine con contenuti molto simili tra loro, il problema è meno grave ma non per questo trascurabile. La duplicazione interna si distingue a sua volta in due tipologie:

 

  1. Il sito presenta più volte lo stesso contenuto testuale in pagine differenti tra loro.

 

Immaginiamo un e-commerce che descriva le modalità di spedizione e di pagamento in ogni pagina relativa ai prodotti. Nonostante le informazioni siano utili all’utente, Google individuerà la duplicazione e di conseguenza il posizionamento del sito sui risultati di ricerca potrebbe risentirne.

 

Qual è la soluzione?

Ad esempio, creare una pagina dedicata alle modalità di spedizione e pagamento ed inserire un link di rimando all’interno di ogni pagina prodotto. Per altri testi che devono necessariamente essere ripetuti in tutte le pagine (ad esempio il menù di navigazione, le categorie, etc.), Google riconosce e comprende questa necessità.

 

Come evitare i contenuti duplicati nel proprio sito?

La regola base è curare e creare i testi di ogni pagina del tuo sito in maniera unica. Ovviamente è un lavoro che richiede tempo e risorse ma i risultati ripagheranno la fatica ;)

  

  1. Lo stesso contenuto testuale è visibile in una sola pagina, che risulta accessibile da più indirizzi differenti.

 

In questo caso, i problemi di contenuti duplicati sono legati alla mancanza di una corretta canonicalizzazione all’interno dello stesso sito. Per “canonicalizzazione” (parolone che intimorisce, ma dal significato molto semplice ;) ) s’intende il processo con il quale indichiamo a Google quale sia l’URL preferita, “canonica” appunto, , quella che vogliamo che venga indicizzata.

 

Lo spider di Google, infatti, non comprende in maniera autonoma la struttura di un sito, e genera un’indicizzazione errata di più URL che, rimandando alla stessa pagina e presentando lo stesso contenuto, creano problemi di duplicazione. Se la gestione della canonicalizzazione avviene invece in maniera corretta, Google potrà indicizzare una solo URL per ogni pagina di un sito internet.

 

Come risolvere questo problema?

Per evitare la duplicazione, esistono alcune regole da seguire:

 

  • creare una versione unica del sito (sitoweb.it o sitoweb.it) per evitare la doppia indicizzazione.

 

 

  • configurare le sezioni del sito da non indicizzare (noindex, nofollow).

 

  • se il sito viene ristrutturato e presenta pagine doppie, è necessario reindirizzare le pagine duplicate alla versione originale (redirect 301)

 

Contenuti duplicati tra due domini

Il secondo caso che riguarda i contenuti duplicati è caratterizzato dalla presenza di testi uguali su due domini separati.

 

Quando lo stesso contenuto testuale viene riproposto in maniera identica o simile da più siti differenti, il filtro anti-duplicazione di Google interviene cercando di dare visibilità e autorevolezza alla pagina considerata originale e penalizzando le duplicate.

Riprendiamo l’esempio dell’e-commerce (la situazione è adattabile comunque ad ogni tipologia di sito).

 

Un prodotto può essere venduto non solo dal sito del produttore ma anche dai siti dei grandi distributori, ad esempio Amazon. Solitamente le descrizioni dei prodotti e tutte le loro informazioni sono create direttamente dal produttore, mentre i distributori si limitano a copiarle sul loro sito. La conseguenza inevitabile è che il contenuto risulti duplicato sul web.

 

Che cosa succede in questi casi?
Google sceglierà uno di questi siti come originale, premiandolo sui risultati di ricerca. Rilegherà tutti gli altri siti all’indice secondario, rendendoli in pratica invisibili agli utenti.

Nel centro assistenza della Search Console, è Google stesso ad affermare:

 

Presta particolare attenzione alla diffusione di contenuti su altri siti. 
Se pubblichi i tuoi contenuti su altri siti, Google visualizzerà sempre la versione ritenuta più appropriata per gli utenti in ciascuna ricerca. Tale versione può essere o meno quella da te preferita.

 

L’ultima frase è abbastanza inquietante…

La soluzione è evitare il più possibile questo tipo di situazioni, curando i testi delle singole pagine in maniera univoca e dando valore aggiunto al proprio sito e ai suoi contenuti.

 

Come emerge da queste considerazioni, i contenuti duplicati rappresentano un ostacolo al ranking del sito, alla sua visibilità e valorizzazione.

Questo è il motivo che ci ha portato a consigliare diversamente i nostri clienti, facendoli ragionare sui vantaggi di avere contenuti freschi e originali e sui “pericoli” della duplicazione.

 

“Sei nato originale. Non morire come copia.” John Mitchell Mason

 

Il nostro consiglio finale: valorizza la tua unicità e confrontati con gli altri solo per migliorare, non per diventare una loro (brutta) copia :)

 

Vuoi ricevere 6 lezioni sul marketing per il B2B?  Come qualificare i clienti, creare contenuti forti, automatizzare i processi e  facilitare il processo d’acquisto, tutto nella tua casella di posta. Lasciaci  la tua mail per iniziare subito il minicorso!  Iscriviti ora