Magazine

La verità sui contenuti duplicati e il loro impatto sulla SEO

26/05/2023

A proposito dei contenuti duplicati, ovvero le loro copie identiche o parziali ma molto simili, Google si è pronunciato in maniera piuttosto chiara: non sono causa di penalizzazione, eccetto che nei casi in cui venga riscontrato un intento fraudolento, per trarre in inganno e manipolare i risultati dei motori di ricerca. O, peggio, quando il suo algoritmo individua un Url di un sito esterno che ospita contenuti altrui senza averne l’autorizzazione: in questo caso, la questione si estende anche oltre, andando a sfociare nelle leggi sul copyright e sulla loro violazione.

A valle di tutte queste considerazioni, la duplicazione dei contenuti resta un tema, comunque, molto importante per l’indicizzazione e il posizionamento di un sito nelle SERP (Search Engine Results Pages), le pagine dei risultati dei motori di ricerca.

Ma che cosa si intende esattamente per contenuti duplicati?

Come abbiamo visto all’inizio di questo articolo, un contenuto si definisce duplicato quando appare in più di una pagina web.

La duplicazione può essere di tipo intenzionale o di tipo accidentale. Si distingue, inoltre, tra interna, quando il contenuto di una pagina web è copiato e riprodotto su altre pagine dello stesso sito web, oppure esterna, cioè quando è copiato e riprodotto su pagine di altri siti. In quest’ultimo caso, si utilizza il termine tecnico di duplicazione cross-domain, che si verifica quando due o più domini diversi hanno la stessa copia di pagina indicizzata dai motori di ricerca, inducendo lo spider in confusione e costringendolo, di conseguenza, a scegliere quali pagine identiche o molto simili posizionare tra i primi risultati: quando la scelta ricade su una delle non originali, il danno sulla SEO e le sue conseguenze risultano ben chiare ed evidenti...

Come risolvere i problemi di duplicazione del contenuto

È la stessa Google a riportare, sul proprio sito, un set di regole da seguire per risolvere in modo proattivo i problemi legati alla duplicazione.

Sullo sfondo della generale avvertenza di evitare il più possibile contenuti simili, i precetti principali riguardano l’utilizzo dei reindirizzamenti 301, e dei domini di primo livello, quanto più possibile.

Un’altra fattispecie è quella relativa alla conformazione dei contenuti pubblicati in syndication, cioè ceduti ad altri siti con l’intento di farli propagare il più possibile e aumentare la propria audience potenziale.

In questo caso, è utile verificare sempre che essi contengano il link che rimanda all’articolo originale e che chi utilizza tali materiali inserisca all’interno del loro codice la tag noindex per impedire ai motori di ricerca di indicizzare le versioni non originali. Questa stessa etichetta dovrà essere presente anche negli stub, le pagine utilizzate come segnaposto di un contenuto che verrà riempito in un tempo successivo e che, pertanto, può restare vuoto o incompleto ma, poiché è comunque pubblicato, verrà indicizzato dal search engine.

Un’altra buona pratica è quella relativa all’impiego corretto dei cosiddetti boilerplate, cioè i testi standard che descrivono le modalità per la riproduzione dei contenuti del sito: il consiglio di Google, qui, è di non inserirli in calce a ogni articolo, ma di linkare in ciascuno di essi un’unica pagina di destinazione che contiene tale descrizione.

I rischi dello “scraping”

A meritare un approfondimento ad hoc, infine, sono le problematiche relative al copyright alle quali abbiamo già fatto cenno in precedenza parlando dell’unica vera causa di penalizzazione.

Riguardano, nello specifico, i contenuti frutto delle operazioni di scraping, cioè quando il proprietario di un sito web ruba, letteralmente, i contenuti da un altro sito nel tentativo di aumentare la visibilità organica del proprio.

In casi sempre più frequenti, lo scraping è accompagnato dall’utilizzo delle tecniche di intelligenza artificiale generativa, con le quali i contenuti rubati vengono riscritti dalle macchine per renderli meno riconoscibili.

Quando ci si accorge di essere vittima del furto di contenuti, la prima cosa da fare è di richiederne la rimozione direttamente all’owner del sito “incriminato”.

Qualora, alla richiesta non dovesse corrispondere un’azione concreta è possibile rivolgersi a Google che incaricherà un suo revisore (umano) di procedere all’esame del sito per determinare se le sue pagine siano, o meno, conformi alle Linee guida per la qualità, alle quali i webmaster devono sempre attenersi, per poi procedere, eventualmente, con i provvedimenti del caso.

Articoli recenti

Simyousoon

Roaming in USA: quanto costa e come risparmiare?

Viaggiare negli Stati Uniti significa muoversi tra aeroporti, metropolitane, ride hailing, prenotazioni, pagamenti digitali: messaggi e ricerche online diventano strumenti quotidiani.

Intelligenza artificiale

Governance dell'AI: dall'AI Act al modello operativo in azienda

L'Intelligenza Artificiale ha smesso di essere una promessa e si è fatta processo. Dopo la fase di sperimentazione che ha caratterizzato il biennio precedente, oggi il tema non è più se adottare l'AI, ma come governarla.

Inside

Il Team Aruba.it Racing – Ducati è Campione del Mondo di Superbike.

A Donington (Gran Bretagna) Bulega e Lecuona scrivono una pagina di storia regalando anche a Ducati il titolo Costruttori.

Hosting

Round ICANN 2026: cosa sono i nuovi gTLD e come funziona la candidatura per un dominio di primo livello

Dal 30 aprile al 12 agosto 2026 imprese, pubbliche amministrazioni, enti territoriali e associazioni possono candidarsi alla creazione di nuove estensioni Internet.

Hosting

Dominio .eu: perché sceglierlo per dare al tuo progetto un'identità europea

Il dominio .eu è l'estensione associata all'Unione europea e una scelta strategica per chi vuole comunicare apertura al mercato continentale.

Articoli più letti

Fatturazione Elettronica

Le scadenze fiscali del 2025

Entro il 31 marzo 2025, i contribuenti che hanno aderito al concordato preventivo biennale entro il 12 dicembre 2024 possono sanare le irregolarità dichiarative afferenti agli anni 2018-2022, versando un’imposta sostitutiva delle imposte sui redditi e relative addizionali e dell’IRAP.

Inside

Data Spaces: condividere i dati senza perderne il controllo. Ecco il futuro dell’economia europea

I data spaces (spazi dati) sono un modo “europeo” e pragmatico di condividere dati tra aziende e partner senza perdere il controllo: un insieme di regole, strumenti e servizi che rendono lo scambio sicuro, tracciabile e interoperabile.

Simyousoon

eSIM vs SIM tradizionale: guida completa 2026

Negli ultimi anni, il mondo della connettività mobile sta vivendo una trasformazione silenziosa ma profonda. La eSIM — abbreviazione di embedded SIM — sta sostituendo gradualmente la SIM tradizionale, offrendo maggiore flessibilità e un approccio più moderno alla gestione delle linee mobili.

Cloud

Superare il lock-in tecnologico nelle architetture IT

Il lock-in tecnologico è una condizione di dipendenza a causa della quale un’organizzazione rimane vincolata a una scelta tecnologica o a un fornitore specifico, a causa di ostacoli in uscita tecnici, economici e contrattuali o legati al tempo necessario per attuare un cambio tecnologico.

Fatturazione Elettronica

Le scadenze fiscali del 2026

Dal 2026, il termine per presentare le dichiarazioni in materia di imposte sui redditi e di IRAP è stabilito dal 15 aprile al 31 ottobre dell’anno successivo al periodo d’imposta cui le stesse si riferiscono.

Hosting e domini

PEC e Trust Services

Connettività

Cloud

Server e colocation

Altri servizi

Aruba Business

Certificati SSL Actalis

Microsoft 365

Pratiche.it

SMS

Magazine

La verità sui contenuti duplicati e il loro impatto sulla SEO

Ma che cosa si intende esattamente per contenuti duplicati?

Come risolvere i problemi di duplicazione del contenuto

I rischi dello “scraping”

Hosting e domini

PEC e Trust Services

Connettività

Cloud

Server e colocation

Altri servizi

Aruba Business

Certificati SSL Actalis

Microsoft 365

Pratiche.it

SMS

Magazine

La verità sui contenuti duplicati e il loro impatto sulla SEO

Ma che cosa si intende esattamente per contenuti duplicati?

Come risolvere i problemi di duplicazione del contenuto

I rischi dello “scraping”

Guide

Assistenza