Comment rédiger un bon sitemap?

Le but de cet article est de vous fournir les bases pour rédiger un bon sitemap. Quelles balises faut-il utiliser? Comment faire pour faciliter le référencement de votre site web grâce aux fichiers sitemaps. Ces fichiers ne sont  pas consultés par les internautes, mais sont très appréciés par les moteurs de recherche (Google, Yahoo, bing, …). Allez, assez parlé. Je vous laisse découvrir par vous même.

A quoi ressemble un sitemap.xml?

Dans sa forme la plus simple, un sitemap est un fichier XML qui liste les URL d’un site web avec en plus quelques meta-données (ce n’est pas un gros mot :p ) renseignant chaque URL :

  • la date de sa dernière mise à jour ;

  • selon quelle fréquence change l’URL ;

  • son importance relativement aux autres URL du site.

Ces informations aident les moteurs de recherche à crawler votre site web intelligemment.

Ce qui donne dans votre fichier XML sitemap.xml :

<?xml version='1.0' encoding='UTF-8' ?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
  <url>
    <loc>http://www.mon-site-web.com</loc>
    <lastmod>2007-06-03</lastmod>
    <changefreq>weekly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>http://www.mon-site-web.com/une-page-web.html</loc>
    <lastmod>2007-05-15</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.1</priority>
  </url>
  <url>
    <loc>http://www.mon-site-web.com/une-autre-page-web.html</loc>
    <lastmod>2007-06-06</lastmod>
    <changefreq>daily</changefreq>
    <priority>0.1</priority>
  </url>
  ...
</urlset>

Toutes ces informations sont-elles vraiment indispensables ? :(

Non :-° . En fait, comme nous le verrons par la suite, la plupart des balises sont optionnelles.

Les différentes balises de votre fichier sitemap

Nous allons maintenant passer au crible toutes les balises du standard XML sitemap.

Tag

Statut

Explication

urlset

obligatoire

Le tag urlset précise la version du standard XML sitemap utilisée. La valeur renvoie à une URL qui décrit le format utilisé dans le fichier courant. Dans la mesure où le standard peut évoluer, ce tag permet de faire cohabiter des anciennes versions du standard avec la dernière sans que cela ne pose problème. Il est donc inutile de mettre à jour son fichier sitemap lorsque le standard évolue (ça tombe bien, les webmasters ne sont pas particulièrement courageux :) ), à moins de vouloir profiter des nouvelles fonctionnalités que celui-ci propose.

url

obligatoire

Le tag url regroupe l’ensemble des informations concernant une unique URL ou page web. Il en faut donc un par URL ou page web décrite dans le fichier sitemap (sitemap.xml).

loc

obligatoire

<loc><a href="http://www.mon-site-web.com"><a href="http://www.mon-site-web.com">http://www.mon-site-web.com</a></a></loc> 
Le tag loc précise l’URL courante, ici http://www.mon-site-web.com/.

lastmod

optionnel

<lastmod>2007-06-03</lastmod> 
Le tag lastmod précise la date de dernière mise à jour de l’URL courante. Cette date doit nécessairement être au format AAAA-MM-JJ, ici 2007-06-03, soit le 3 juin 2007.

changefreq

optionnel

<changefreq>weekly</changefreq> 
Le tag changefreq précise avec quelle fréquence change l’URL courante. Il peut prendre les valeurs always, hourly, dayly, weekly, monthly, yearly, never pour respectivement toujours (à chaque nouvel accés à l’URL courante), chaque heure, chaque jour, chaque semaine, chaque mois, chaque année, ou jamais (pour les URL archivées), ici weekly, soit chaque semaine.

priority

optionnel

<priority>1.0</priority> 
Le tag priority précise l’importance de l’URL courante relativement aux autres URL du même site (priority = 0.1, 1.0, etc.). Sa valeur varie de 0.0 (priorité faible) à 1.0 (priorité forte). S’il est absent, alors la valeur par défaut est 0.5. Dans le cas présent, la valeur 1.0 indique une forte priorité.

Comment les moteurs de recherche trouvent mon fichier sitemap ?

Les 4 principaux moteurs de recherche Google, Yahoo, MSN Live Search et Ask vérifient régulièrement les fichiers robots.txt des sites web. L’ajout d’une ligne dans ce fichier suffit alors pour indexer votre fichier sitemap. Ce qui donne dans votre fichier robots.txt :

Sitemap: <lien url="http://www.mon-site-web.com/sitemap.xml">http://www.mon-site-web.com/sitemap.xml</lien>

Vous pouvez néanmoins devancer leurs visites en soumettant directement vos fichiers sitemap à Google, Yahoo et Ask. Pour Google et Yahoo, il vous faudra un compte. Alors que pour Ask, il suffit depinger l’URL qui suit avec l’adresse de votre sitemap en paramètre http://submissions.ask.com/ping?sitema […] n-sitemap.xml.

Vous souhaitez consulter l’article original? C’est par ici. CC copyright.

3 comments

Leave a Reply

Your email address will not be published. Required fields are marked *

CommentLuv badge