realizzazione siti internet bologna
siti internet bologna800 030615

Qualche domanda sui contenuti duplicati...

Scritto da Luca Mainieri
Martedì 21 Settembre 2010 10:20

Vorrei tornare sull'argomento dei contenuti duplicati che è stato ampiamente trattato sulla rete, in quanto alcuni clienti mi segnalano ancora dei dubbi in merito. E' chiaro che nel tentativo di popolare un nuovo sito o di aumentare i contenuti di un sito esistente, il tentativo di 'prendere spunto dalla rete' è sempre forte, cercando riferimenti, testi, immagini e quanto altro ci possa aiutare a fare partire il progetto con il piede giusto.

Tuttavia la pratica di prendere in prestito dalla rete ha ovviamente degli aspetti legali (il copyright!!), degli aspetti etici e degli aspetti relativi all'indicizzazione e presenza sui motori di ricerca. Non mi vorrei occupare dei primi due aspetti in quanto non sono competente in materia. Tuttavia per quanto riguarda l'indicizzazione e posizionamento sui motori di ricerca, il contenuto duplicato (o copiato, per dirla tutto) può avere degli effetti indesiderati. Pertanto rispondo a qualche domanda che mi ha fatto un cliente in merito.

 

Cos'è un contenuto duplicato?

Con il termine “contenuto duplicato” si intende generalmente  blocchi sostanziali di contenuto che corrispondono (sono uguali o simili) all'interno della stessa struttura del sito o tra siti diversi.

Perché i motori di ricerca penalizzano i contenuti duplicati?

In generale i motori di ricerca operano per indicizzare contenuti distinti nel tentativo di fornire agli utenti informazioni esclusive, differenziate e rilevanti. La presenza di più siti o più pagine con lo stesso contenuto porta il motore a scartare i risultati duplicati percependole come copie di un contenuto originale. In questa operazione, il motore opera per indivi-duare la copia originale.
La copia ritenuta ‘contraffatta’ può essere completamente o parzialmente rimossa dall’indice dei risultati e risultare quindi non presente nei risultati delle ricerche.

Con quali criteri il motore di ricerca individua o confronta le pagine?

L’algoritmo nel suo complesso non è noto, ma si può supporre che il confronto avvenga durante la scansione del testo, la rilevazione delle metriche fondamentali ed il confronto del sito con altri con metriche simili (esempio, tipo di ke-ywords e numero delle stesse, presenza e posizione delle keywords nel testo, etc.). Nel fare questo confronto il testo è normalizzato, ossia privato di elementi grafici e di ortografia (esempio di doppi spazi, andate a capo, punteggiatura, etc.) e dei markup (ossia elementi di codice in HTML), degli elementi di navigazione e di disturbo (immagini, banners, css, etc).

Ci sono casi leciti di contenuti duplicati?

In generale non è possibile segnalare siti con contenuti uguali, segnalando che la copia è stata fatta in forma lecita. In ogni caso il motore di ricerca tenderà sempre a percepire la copia come SPAM (ossia il tentativo di aumentare la propria presenza sul web per aumentare la visibilità ed il traffico). Esistono dei casi dove il contenuto duplicato è lecito, ad esempio nella versione “printer-friendly” di una pagina di con-tenuto, o anche nella condivisione di contenuti con feed RSS. Occorre quindi segnalare uno dei siti come referente al sito originale, ed impedirne l'indicizzazione.

Come comportarsi nel caso sia presente del contenuto duplicato ?


Il modo migliore di comportarsi è sempre la redazione di testi originali. Questo permette di aumentare il posizionamento ma anche l’autorevolezza del sito e la credibilità verso i visitatori.
Nel caso sia presente del contenuto duplicato, per evitare di venire penalizzati e quindi scomparire dagli indici dei mo-tori di ricerca, occorre implementare una serie di azioni:

1.    Aiutare gli algoritmi a determinare quale sia la versione del documento che si vuole far indicizzare, per esempio, disabilitando le versioni stampabili o usando espressioni regolari nel file robots.txt
2.    Usare i redirect per indirizzare gli utenti verso i contenuti originali
3.    Usare NO FOLLOW o NO INDEX tags sui siti che pubblicano contenuto duplicato
4.    Canonizzare le pagine, indicando il sito o la pagina preferenziale. Per esempio se ci sono due pagine con lo stesso contenuto (www.pagina1.com e www.pagina2.com) basta indicare che la seconda è una copia inse-rendo nella head di www.pagina2.com il tag rel=canonical come segue: <link rel="canonical" href="/ http://www.pagina1.com">


Come posso scovare se qualcuno sta copiando del contenuto dal mio sito?

Uno strumento utile per capire se qualcuno sta duplicando del contenuto è quello offerto dal sito Copyscape (http://www.copyscape.com/) che individua contenuti duplicati registrati nelle pagine dei motori di ricerca. Un altro strumento molto interessante è Duplicate Content (http://www.duplicatecontent.net/) che permette di confrontare due siti e fornisce una serie di metriche per il confronto. Molti esempi di quello che potrebbero essere giudicato copia di contenuto sono molto utili per la veicolazione di contenuti. Come fanno moltissimi aggregatori di blog o strumenti di condivisione dei con-tenuti (tipico del web 2.0).


blog comments powered by Disqus
Hai trovato le informazioni in questa pagina interessanti?
Vorresti maggior informazioni in merito ai nostri servizi di consulenza e realizzazione siti internet?
Compila il modulo sottostante o clicca qui!

Nome (*)
Email (*)
Telefono
Messaggio (*)
E ora un po' di matematica:
quanto fa tre più due?
(*)
 
I campi contrassegnati con (*) sono richiesti