Magazine

La verità sui contenuti duplicati e il loro impatto sulla SEO

26/05/2023
Contenuti duplicati e il loro impatto sulla SEO
A proposito dei contenuti duplicati, ovvero le loro copie identiche o parziali ma molto simili, Google si è pronunciato in maniera piuttosto chiara: non sono causa di penalizzazione, eccetto che nei casi in cui venga riscontrato un intento fraudolento, per trarre in inganno e manipolare i risultati dei motori di ricerca. O, peggio, quando il suo algoritmo individua un Url di un sito esterno che ospita contenuti altrui senza averne l’autorizzazione: in questo caso, la questione si estende anche oltre, andando a sfociare nelle leggi sul copyright e sulla loro violazione.
 
A valle di tutte queste considerazioni, la duplicazione dei contenuti resta un tema, comunque, molto importante per l’indicizzazione e il posizionamento di un sito nelle SERP (Search Engine Results Pages), le pagine dei risultati dei motori di ricerca.

Ma che cosa si intende esattamente per contenuti duplicati?

Come abbiamo visto all’inizio di questo articolo, un contenuto si definisce duplicato quando appare in più di una pagina web.
 
La duplicazione può essere di tipo intenzionale o di tipo accidentale. Si distingue, inoltre, tra interna, quando il contenuto di una pagina web è copiato e riprodotto su altre pagine dello stesso sito web, oppure esterna, cioè quando è copiato e riprodotto su pagine di altri siti. In quest’ultimo caso, si utilizza il termine tecnico di duplicazione cross-domain, che si verifica quando due o più domini diversi hanno la stessa copia di pagina indicizzata dai motori di ricerca, inducendo lo spider in confusione e costringendolo, di conseguenza, a scegliere quali pagine identiche o molto simili posizionare tra i primi risultati: quando la scelta ricade su una delle non originali, il danno sulla SEO e le sue conseguenze risultano ben chiare ed evidenti...

Come risolvere i problemi di duplicazione del contenuto

È la stessa Google a riportare, sul proprio sito, un set di regole da seguire per risolvere in modo proattivo i problemi legati alla duplicazione.
 
Sullo sfondo della generale avvertenza di evitare il più possibile contenuti simili, i precetti principali riguardano l’utilizzo dei reindirizzamenti 301, e dei domini di primo livello, quanto più possibile.

Un’altra fattispecie è quella relativa alla conformazione dei contenuti pubblicati in syndication, cioè ceduti ad altri siti con l’intento di farli propagare il più possibile e aumentare la propria audience potenziale.

In questo caso, è utile verificare sempre che essi contengano il link che rimanda all’articolo originale e che chi utilizza tali materiali inserisca all’interno del loro codice la tag noindex per impedire ai motori di ricerca di indicizzare le versioni non originali. Questa stessa etichetta dovrà essere presente anche negli stub, le pagine utilizzate come segnaposto di un contenuto che verrà riempito in un tempo successivo e che, pertanto, può restare vuoto o incompleto ma, poiché è comunque pubblicato, verrà indicizzato dal search engine.
 
Un’altra buona pratica è quella relativa all’impiego corretto dei cosiddetti boilerplate, cioè i testi standard che descrivono le modalità per la riproduzione dei contenuti del sito: il consiglio di Google, qui, è di non inserirli in calce a ogni articolo, ma di linkare in ciascuno di essi un’unica pagina di destinazione che contiene tale descrizione.

I rischi dello “scraping”

A meritare un approfondimento ad hoc, infine, sono le problematiche relative al copyright alle quali abbiamo già fatto cenno in precedenza parlando dell’unica vera causa di penalizzazione.

Riguardano, nello specifico, i contenuti frutto delle operazioni di scraping, cioè quando il proprietario di un sito web ruba, letteralmente, i contenuti da un altro sito nel tentativo di aumentare la visibilità organica del proprio.
 
In casi sempre più frequenti, lo scraping è accompagnato dall’utilizzo delle tecniche di intelligenza artificiale generativa, con le quali i contenuti rubati vengono riscritti dalle macchine per renderli meno riconoscibili.
 
Quando ci si accorge di essere vittima del furto di contenuti, la prima cosa da fare è di richiederne la rimozione direttamente all’owner del sito “incriminato”.
 
Qualora, alla richiesta non dovesse corrispondere un’azione concreta è possibile rivolgersi a Google che incaricherà un suo revisore (umano) di procedere all’esame del sito per determinare se le sue pagine siano, o meno, conformi alle Linee guida per la qualità, alle quali i webmaster devono sempre attenersi, per poi procedere, eventualmente, con i provvedimenti del caso.