Qu'est-ce qu'un sitemap XML et comment en créer un ?
Publié: 2020-11-20La création d'un site Web demande beaucoup de discipline et de curiosité pour qu'il soit remarqué dans un paysage Internet en constante expansion - l'une des étapes fondamentales du succès du référencement est un sitemap.
Un protocole de plan de site est une feuille de route pour votre site Web. Des sitemaps utiles permettent aux moteurs de recherche d'explorer votre site plus efficacement. Google a introduit le protocole pour la première fois en 2005, permettant aux développeurs de publier des liens à partir de leurs sites.
Le support conjoint de Yahoo et Microsoft est arrivé en 2006, et plus tard cette année-là, Ask.com et IBM ont apporté leur soutien au nouveau protocole. L'une des avancées significatives du protocole a été la découverte automatique via le fichier robots.txt.
Qu'est-ce qu'un plan du site ?
La fonction d'un moteur de recherche est de parcourir Internet à la recherche de nouveaux codes et de nouvelles pages Web. Une deuxième fonction consiste à indexer le contenu et à le placer dans une hiérarchie détectable, la dernière pièce du puzzle ; afficher le contenu aux requêtes pertinentes.
Les sitemaps sont l'interface entre un site Web et les moteurs de recherche. Un sitemap Google est une extension de fichier XML permettant aux webmasters d'informer les robots d'exploration des URL nouvelles et modifiées. Des sitemaps utiles indiquent aux robots la date de la dernière mise à jour de l'URL et son importance pour les autres URL du site. Voici à quoi peut ressembler un sitemap :

(Crédit image : DYNO Mapper)
Les humains utilisent les sitemaps comme marqueur SEO pour leurs sites Web. Cependant, il faut bien le comprendre : un index de sitemap est destiné aux crawl bots des moteurs de recherche. Tout ce que les webmasters peuvent faire pour augmenter cette communication, mieux c'est.
Les moteurs de recherche envoient périodiquement des robots ou des araignées pour trouver du contenu mis à jour. Les robots sont de petits morceaux de code qui s'interfacent avec le moteur et votre site Web. Plus votre sitemap est efficace, plus il est facile pour un moteur de recherche de découvrir et d'indexer de nouveaux contenus et liens.
L'exploration est le processus par lequel les robots visitent des sites Web en fonction de l'algorithme de fréquence d'un moteur de recherche et d'autres facteurs. Les robots utilisent des liens pour découvrir d'autres pages en accordant une attention particulière au nouveau contenu et aux changements de sujet existants.
Google et d'autres moteurs ont donné aux webmasters un choix précis lorsque les robots de recherche explorent leurs sites. Cette fonctionnalité est une avancée significative par rapport aux politiques obscures du passé.
Si vous configurez votre plan de site Google, vous devez respecter quelques conditions :
- L'emplacement de votre sitemap doit être dans le répertoire racine de votre site Web. Les crawl bots commencent généralement à la racine et se déplacent vers l'extérieur. S'il existe un sitemap, vous avez facilité la tâche du bot.
- Deuxièmement, chaque URL suivante doit être identique au sitemap. Si le sitemap utilise le protocole HTTP :, chaque URL doit avoir la même extension HTTP :.
- Les principaux moteurs de recherche autorisent désormais plusieurs fichiers de plan de site dans un seul répertoire pour faciliter l'exploration. Le nombre maximal d'URL autorisées dans un seul fichier de sitemap est de 50 000. Les webmasters peuvent décomposer davantage ce nombre et disposer de plusieurs plans de site pour mieux définir la structure du site Web.
- Suivez les formats de sitemap de Sitemaps.org pour établir le bon schéma pour votre site.
SEO et votre sitemap
Chaque site Web a besoin d'un plan de site et de savoir comment créer des plans de site xml, qu'ils soient nouveaux avec une seule page ou une boutique de commerce électronique avec des milliers de produits. Les sites Web bénéficient lorsque les moteurs de recherche peuvent facilement trouver des pages importantes et quand elles ont été mises à jour pour la dernière fois.
Un sitemap dans la structure de votre site Web indique aux moteurs de recherche que chaque URL incluse est une page de destination de qualité.
Les meilleures pratiques de référencement sont toujours en évolution ; ce qui était d'excellents conseils hier sur la façon de créer un sitemap xml a peut-être changé aujourd'hui. Il est sage de connaître l'emplacement des meilleures pratiques de référencement pour chacun des moteurs de recherche ciblés par votre site Web.
Éloignez-vous des opinions amplifiées sur les blogs et les forums. Concentrez-vous sur ce qui est essentiel, comme les exigences d'un sitemap google xml. Prenez le temps de diffuser le bruit et formez vos meilleures pratiques à partir des principaux moteurs.
Vous serez intéressé
Comment faire évoluer votre entreprise avec succès
Vitesse de chargement du site Web : outils d'optimisation
Bilan de santé du site Web : outils et astuces
Que signifie UX ?
Format d'un sitemap XML
- org est la source définitive de ce qu'est le protocole sitemap xml et comment structurer un sitemap. Le formatage correct d'un sitemap XML consiste en une série de balises descriptives. Chaque valeur doit être échappée par l'entité, ce qui signifie que le sitemap est encodé en UTF-8. Par example:

(Crédit image : Plans du site)
UTF-8 est l'abréviation de Unicode Transformation Format-8 Bit. Cette désignation représente un caractère standard de communication électronique à largeur variable. Autre condition de formatage : chaque URL du sitemap doit être encodée pour être lisible par le serveur Web.
Voici les définitions des balises de sitemap ; certains sont quelques-unes des exigences du plan de site google xml, tandis que d'autres sont facultatifs.
- <urlset> est une balise obligatoire. Cette norme fait référence ; qu'est-ce que le protocole sitemap xml et décrit le fichier.
- <url> est la balise parent de chaque entrée. Chaque balise après cette entrée est une balise enfant.
- <loc> est une autre balise obligatoire. Cette fonctionnalité fait référence à l'URL et commence par un protocole tel que HTTP ou HTTPS, et doit se terminer par une barre oblique si le serveur Web l'exige. Cette valeur doit être inférieure à 2 048 caractères.
- <lastmod> est une balise facultative qui définit quand le fichier a été modifié pour la dernière fois. La balise doit être au format date/heure W3C. La balise est distincte de la balise if-modified-since. Les moteurs de recherche peuvent utiliser des informations provenant de sources alternatives.
- <changefreq> est une autre balise facultative qui améliore la facilité de recherche du sitemap. Cette balise affiche la fréquence à laquelle la page est susceptible de changer.
Toujours, utilisé pour décrire les documents qui changeront à chaque accès :
- Horaire
- du quotidien
- Hebdomadaire
- Mensuel
- Annuel
- Jamais, URL archivées
Les robots d'exploration Web peuvent accéder à une page plus souvent qu'une fois par heure et peuvent explorer plus fréquemment les pages marquées annuellement. Les pages marquées de jamais peuvent être explorées pour gérer les changements inattendus.
- <priority> est une balise d'URL relative aux autres URL du site. Les valeurs vont de 0,0 à 1,0, la valeur par défaut étant 0,5. La valeur n'affecte pas la façon dont les pages sont comparées à d'autres sites. La balise affiche les exigences du sitemap google xml et les pages que le webmaster juge les plus importantes pour les robots.
Les priorités attribuées ne sont pas susceptibles d'influencer la position de recherche. Les webmasters peuvent utiliser cette balise pour augmenter la probabilité que les pages les plus importantes soient indexées.
Créer un plan du site
La création d'un index de plan de site peut sembler écrasante au début si c'est votre première fois. Les sitemaps sont conçus pour les robots d'exploration des moteurs de recherche, pas pour les humains. Comme nous l'avons dit, il existe de nombreux outils dans le référencement moderne qui créent des sitemaps parfaits.
Il est essentiel de comprendre la structure de XML pour s'assurer que les outils font leur travail.
Décomposons un simple sitemap :
- Déclaration XML : cette déclaration indique au robot du moteur de recherche ce qu'il lit ; dans la plupart des cas, il s'agit d'un type de fichier XML. D'autres déclarations indiquent au bot ; informations de version et type d'encodage. Le plan du site doit être UTF-8.
- URL Set : cette section contient les URL du sitemap. L'ensemble d'URL informe les bots de la norme utilisée. La norme la plus courante est 0,90, qui est prise en charge par Google, Microsoft et Yahoo.
- URL : les webmasters doivent indiquer au bot chaque URL imbriquée dans la balise <loc>. Il est crucial de déclarer; les URL doivent être des URL canoniques absolues et non relatives. La balise <loc> est le seul élément requis à ce stade.
Une fois que le webmaster a déclaré l'URL, il peut utiliser l'une des balises facultatives ci-dessus pour mieux comprendre chaque entrée. N'incluez que les pages SEO pertinentes ; vous aidez le crawl bot à travailler plus intelligemment, ce qui aide votre père à récolter les bénéfices d'une bonne session de crawl.
Un bot d'exploration arrive sur un site Web avec des paramètres prédéterminés pour explorer un site d'exemple de plan de site xml. Ces paramètres sont généralement basés sur les derniers résultats. Ne perdez pas de temps précieux avec les robots d'exploration en incluant des pages de sites Web moins pertinentes, uniquement les meilleures.
Testez le référencement et les performances de votre site en 60 secondes !
Une bonne conception de site Web est essentielle à l'engagement et aux conversions des visiteurs, mais un site Web lent ou des erreurs de performances peuvent rendre même le site Web le mieux conçu sous-performant. Diib est l'un des meilleurs outils de surveillance des performances et du référencement des sites Web au monde. Diib utilise la puissance du Big Data pour vous aider à augmenter rapidement et facilement votre trafic et vos classements. Comme on le voit dans Entrepreneur !
- Outil de référencement automatisé facile à utiliser
- Surveillance des mots-clés et des backlinks + idées
- Assure la vitesse, la sécurité, + le suivi Core Vitals
- Suggère intelligemment des idées pour améliorer le référencement
- Plus de 250 000 000 membres dans le monde
- Analyse comparative et analyse des concurrents intégrée
Utilisé par plus de 250 000 entreprises et organisations :
 Se synchronise avec 
Pages à NE PAS inclure dans votre sitemap :
- Pages utilitaires et archivées
- Pages bloquées par le fichier robots.txt et pages noindex
- Pages et publications dupliquées et paginées
- Pages non canoniques
- Réponses aux commentaires et URL des e-mails
- Redirection, pages manquantes et pages d'erreur
Soyez prudent avec un générateur de sitemap html. Certains ne sont pas fiables et pratiquent un mauvais référencement en incluant des URL non canoniques et des pages sans index.

Avoir des pages de mauvaise qualité dans un sitemap a des conséquences désastreuses sur le référencement :
- Le premier et le plus important; ils font perdre un temps précieux au budget de crawl. Ce temps pourrait être mieux utilisé pour explorer pleinement uniquement les meilleures pages et liens de votre site.
- Les pages de mauvaise qualité volent l'autorité des liens des pages qui peuvent être mieux classées. Par exemple, le blog aHrefs a supprimé un tiers de ses messages insignifiants et a constaté que le trafic avait augmenté.
- Les utilisateurs trouvent une expérience de niveau inférieur s'ils sont dirigés vers des pages non essentielles. Les visiteurs sont agacés lorsqu'ils atterrissent sur des pages sans valeur d'un site Web et s'en éloignent rapidement. Ne conservez que les meilleures pages d'un site Web.
Différents types de plans de site
Il existe aujourd'hui plus de 140 moteurs de recherche et annuaires à travers le monde. Au dernier décompte, Google a indexé près de 4,5 milliards de pages Web. Au fur et à mesure qu'Internet se développe, le nombre de types de sitemaps augmente également, générateur de sitemap html. La question devient-elle ce qu'est sitemap.xml dans le référencement ?
À mesure que la complexité et la taille des sites Web continueront de croître, les technologies de plan de site augmenteront également.
Plan du site XML
XML Sitemap est le fichier standard pour faire remarquer votre site sur Internet. Cependant, il existe certaines limitations au sitemap XML. Pas plus de 50 000 URL peuvent être traitées, et il y a une limite de taille de 50 Mo.
Si votre sitemap dépasse l'une des deux limites, il devra être divisé dans un autre fichier de sitemap. Les grands sites peuvent adopter une approche granulaire en créant plusieurs fichiers d'index si nécessaire.
À partir du blog Google Webmaster, exemple de sitemap xml de plusieurs fichiers d'index :
- xml http://example.com/stores/store2_sitemapindex.xml http://example.com/stores/store3_sitemapindex.xml
La création de fichiers d'index séparés est idéale pour une organisation multi-sites. Ou les magasins qui souhaitent soumettre du contenu à différents moments de la journée. Les webmasters se demandent ce qu'est sitemap.xml dans le référencement. L'image ci-dessous montre un autre exemple de sitemap XML :

(Crédit image : Search Engine Journal)
Plan du site d'images XML
XML Image Sitemap est une excellente ressource pour les sites contenant de nombreuses vidéos ou images avec du contenu.
Les sitemaps d'images peuvent être inutiles en raison des pratiques de référencement modernes. La plupart des sites Web ont des images intégrées dans leurs pages. Les moteurs de recherche explorent les images avec n'importe quel contenu de page. Voici un exemple de sitemap d'image XML :

(Crédit image : SwissUpLabs)
Utilisez le balisage ; JSON-LD schema.org/ImageObject, donnant au webmaster plus d'options de personnalisation.
Les sitemaps d'images occupent trop de budgets d'exploration pour la plupart des sites Web. Si vous avez un site Web où les images sont une partie fondamentale du site, examinez attentivement les options. Les sites de commerce électronique et de jeux peuvent bénéficier d'un fichier image de sitemap.
Fichiers XML vidéo
Les fichiers vidéo XML sont similaires au sitemap d'image. Si les vidéos sont essentielles au succès de votre site Web, soumettez un fichier vidéo XML pour exploration. Par exemple:

(Crédit image : Moz)
Encore une fois, ne perdez pas le temps précieux dont disposent les sites lorsqu'un bot vient ramper.
XML dynamique
Dynamic XML met automatiquement à jour les plans de site qui, autrement, seraient du contenu obsolète. Les sitemaps statiques deviennent obsolètes dès que le contenu est modifié ou révisé de quelque manière que ce soit. Les sitemaps statiques ne tirent pas parti de la balise lastmod.
Les meilleures pratiques SEO modernes ont conçu des sitemaps dynamiques pour un contenu en constante évolution. Le serveur d'un webmaster soumet automatiquement un nouveau plan du site chaque fois que des modifications sont apportées.
Chacune de ces étapes peut aider le webmaster à créer un fichier de sitemap dynamique :
- Demandez à votre développeur de coder un script personnalisé ; indiquant la tâche à accomplir
- Utiliser un outil générateur de sitemap
- La majorité des plateformes CMS proposent des plugins pour générer un fichier XML de sitemap dynamique.
Plans de site HTML
Les sitemaps HTML sont des fichiers d'indexation à l'ancienne et ne doivent être utilisés que si d'autres fichiers XML ne conviennent pas à l'application. Les sitemaps HTML ont été conçus pour aider les utilisateurs humains à trouver du contenu.
Les sitemaps HTML attestent de la qualité de la qualité des liens d'un site. Le plan du site HTML doit être considéré avec soin pour toute raison d'exister. Si les webmasters ont conçu leurs sites avec une politique de liens ferme et un sitemap XML ; demande toi; un sitemap HTML est-il nécessaire ?
Dans la plupart des instances; Non.
Nous espérons que vous avez trouvé cet article utile.
Si vous souhaitez en savoir plus sur la santé de votre site, obtenir des recommandations et des alertes personnalisées, analysez votre site Web par Diib. Cela ne prend que 60 secondes.
Plans de site Google Actualités
Les sitemaps Google Actualités sont limités aux sites enregistrés auprès du moteur de recherche. Les restrictions sont des articles de presse publiés au cours des deux derniers jours jusqu'à un maximum de 1000 URL.
Les sitemaps Google Actualités ne prennent pas en charge les sitemaps contenant des images ou des vidéos.
Le moteur de recherche recommande d'utiliser schema.org pour spécifier les attributs d'une image miniature. Par exemple:

(Crédit image : G-Squared Interactive)
Plans de site mobiles
Les sitemaps mobiles sont du code hérité et sont disponibles pour les webmasters, mais ne sont généralement jamais nécessaires. Les fichiers XML mobiles sont destinés aux pages de téléphones polyvalents, pas aux smartphones. Ces plans de site n'ont aucun avantage pour les webmasters à moins que le site Web n'ait des URL spécifiques pour ce type de plate-forme.
Optimiser le référencement avec les sitemaps
Maintenant que les bases ont été couvertes, il est temps de voir comment les sitemaps sont inestimables pour les sites Web. Les webmasters ne doivent pas inclure toutes les pages de leur site Web dans un sitemap, mais uniquement les pages pertinentes et faisant autorité en matière de référencement.
Cinq raisons SEO pour créer un sitemap
- Les sitemaps sont gratuits et très faciles à créer. Comme indiqué précédemment, chaque plate-forme CMS possède plusieurs plugins et scripts de plan de site. WordPress possède à lui seul des dizaines d'applications différentes, allant d'un plan de site unique à des services de référencement complets.
Les plans de site sont des outils de référencement inestimables. Ils encouragent chaque moteur de recherche à indexer davantage le contenu de votre site Web et à l'indexer correctement.
Il est conseillé de créer un sitemap dans le cadre d'une stratégie globale de référencement efficace. Fonctionnalités WordPress ; Plugins Yoast SEO et All in One qui offrent des fonctionnalités utiles.
- Classement amélioré. Les images et les vidéos peuvent améliorer le classement de recherche de votre site en fournissant des informations supplémentaires aux crawl bots.
L'utilisation d'un sitemap pour les vidéos hébergées sur votre site signifie que les webmasters peuvent inclure des métadonnées supplémentaires pour chaque vidéo. Les informations peuvent inclure les emplacements, le titre, la description, la durée, le nombre de vues et les catégories. Les mêmes données peuvent être incluses pour chaque image intégrée dans votre site.
- Priorité d'exploration. Les pages de grande valeur reçoivent une priorité d'exploration avec un sitemap. S'il n'y a pas de feuille de route vers un site Web, les crawl bots n'ont aucune direction une fois qu'ils ont atteint votre site.
Contrôler le processus d'exploration devrait être une priorité absolue pour les webmasters. Les webmasters peuvent créer des priorités pour chacune de leurs pages. Par exemple, une page d'accueil peut avoir une priorité de 100 %, tandis que des documents de bas niveau peuvent avoir une priorité de 60 %. Cette souplesse est bénéfique pour définir la valeur de votre site, page par page.
- Découvrez plus de pages. Les sitemaps valides aident les crawl bots à découvrir plus de pages, ce qui signifie que plus de contenu est indexé.
Les sitemaps ne garantissent pas des résultats de recherche plus élevés, seulement qu'une plus grande partie du contenu du site Web est découverte.
Autre fonctionnalité essentielle, les sitemaps protègent contre le contenu dupliqué. Il est frustrant de publier un contenu original plus tard pour retrouver le même contenu sur le site Web d'un concurrent.
Si deux éléments de contenu identiques sont trouvés, les moteurs essaient de conserver l'original et suppriment le doublon. Les moteurs de recherche exploreront un site plus souvent si un sitemap valide est utilisé. Ils ne reçoivent pas toujours le bon appel sur l'original, mais vous avez la protection.
- Liens. Les moteurs de recherche, principalement Google, peuvent ajouter des liens de site supplémentaires vers un site Web s'il comprend un plan du site. L'algorithme de Google peut ajouter des liens précieux sous la liste organique du site, donnant aux utilisateurs une image plus complète de la requête. Ce processus est automatisé ; cependant, les chances sont meilleures si un site Web a un sitemap.
- Les erreurs sont minimisées. Les erreurs d'exploration sont mises en évidence ; si vous donnez à Google l'emplacement d'un sitemap valide, le moteur de recherche vous rend la pareille en donnant aux webmasters des informations sur l'exploration. Utilisez Google Search Console et Bing Webmaster pour soumettre des sitemaps.
Les bots parcourent le site et rapportent leurs découvertes. Cette ressource est inestimable pour les meilleures pratiques de référencement.
Diib : Obtenez les dernières métriques sur votre plan de site XML
Le référencement commence au niveau granulaire d'un site Web dans le répertoire racine. Les webmasters doivent comprendre la hiérarchie de chaque site et page et les construire en pensant aux moteurs de recherche. Diib Digital offre les métriques les plus complètes et les plus à jour sur la santé de votre plan de site XML et vous alertera des éventuels problèmes bien avant qu'ils n'affectent gravement votre classement ou votre trafic. Voici quelques-unes des fonctionnalités de notre tableau de bord utilisateur que vous allez adorer :
- Suivi et santé du sitemap
- Surveillance de domaine 24h/24 et 7j/7
- Réparation du taux de rebond
- Post-performance
- Pages cassées où vous avez des backlinks (vérificateur 404)
- Outils de surveillance et de suivi des mots clés, des backlinks et de l'indexation
- Expérience utilisateur et optimisation de la vitesse mobile
Obtenez une analyse de site gratuite de 60 secondes ou appelez simplement le 800-303-3510 pour parler à l'un de nos experts en croissance.

