Google, nella sua corsa all’indicizzazione di tutte le informazioni disponibili, ha creato un protocollo xml, chiamato Sitemaps, che serve ad elencare tutte le URL di un sito.

Nato come un progetto di Google, il 16 Novembre 2006, è stato adottato anche da Yahoo ed MSN ed è stato creato il sito sitemaps.org, dedicato al progetto, in cui sono presenti la descrizione del protocollo ed alcune FAQ.

Google ha messo a disposizione una serie di tool per i webmaster (leggine la descrizione su Wikipedia), tra cui anche la possibilità di segnalare la posizione dei propri sitemaps, che il loro spider controlla periodicamente.
Yahoo, invece, permette la segnalazione dei sitemaps tramite il suo Site Explorer.
Al momento non risulta, invece, che MSN abbia attivato un sistema di gestione dei sitemaps per i webmaster, sebbene la Microsoft abbia detto che sarà attivato nel corso del 2007.

Un file sitemap non è altro che un file xml contenente l’elenco delle URL del proprio sito, con la possibilità di inserire per ciascuna dei dati opzionali: la data di ultima modifica della pagina, la frequenza di aggiornamento e la priorità rispetto alle altre URL del sito.
Questi dati vengono impiegati dai motori di ricerca per migliorare la visualizzazione delle URL nei risultati e per ottimizzare i ritmi di crawling delle pagine, anche se i dati forniti sono considerati solo come “suggerimenti” del webmaster.
I sitemaps possono essere al massimo grandi 10MB (10.485.760 bytes) e non possono contenere più di 10.000 URL, ma è stata inserita la possibilità di dividere un sitemap in più file con anche l’utilizzo di un file di indice.
Ultile infine, per limitare l’utilizzo della bandwith del proprio sito è la possibilità di gzippare i file, riducendone di molto le dimensioni.

Nei gruppi di discussioni di Google, dedicati ai webmaster, si sono letti molti messaggi di utenti che lamentavano la sparizione del proprio sito dai risultati all’inserimento di un sitemap.
Per mia esperienza diretta questi due eventi non sono correlati. All’inserimento di un sitemap ho solo assistito ad un incremento del numero di pagine del sito indicizzate da Google. Questo chiaramente può far subire variazioni al ranking del sito nella misura in cui l’algoritmo “segreto” di Google tenga anche conto di dati distribuiti su tutte le pagine di un sito, piuttosto che sulla singola URL, ma questo, al momento, non è dato saperlo.

In un prossimo articolo descriverò un progetto opensource, a cui ho marginalmente collaborato, che permette di generare molto semplicemente un sitemap del proprio sito.

Mic




Segnala questo post su ZicZac: Segnala questa notizia! oppure leggi altri nostri articoli:


Scrivi un commento