Comment éviter le contenu dupliqué ?
Publié: 2020-10-13En tant que propriétaire de site Web, il est important que vous compreniez comment éviter le contenu en double, car ce type de contenu est souvent le signe de sites Web de mauvaise qualité et de « spam ». Le contenu dupliqué peut vous coûter cher si vous cherchez à augmenter votre notoriété sur Google et d'autres moteurs de recherche.
L'une des meilleures façons de marquer votre entreprise en ligne consiste à développer constamment un contenu unique, de premier ordre et crédible pour votre public - un contenu qui apporte de la valeur.
Alors que les moteurs de recherche aiment le contenu frais, ils n'aiment pas les sites Web avec du contenu en double. Chaque fois que vous soumettez un contenu en double, vous obligez les moteurs de recherche à décider lesquels de vos pages/sites doivent être crédités pour le contenu publié. Les moteurs de recherche peuvent ne pas classer ou indexer certains des sites Web avec du contenu en double, c'est pourquoi vous devez éviter le contenu en double interne et le contenu en double entre domaines.
Dans cet article, nous allons examiner la meilleure façon de détecter et d'éviter les doublons. Poursuivez votre lecture pour en savoir plus.
Qu'est-ce que le contenu dupliqué ?
Le sujet du contenu dupliqué confond généralement beaucoup de gens. Selon Google Search Console, « le contenu en double fait généralement référence à des blocs de contenu substantiels dans ou entre des domaines qui correspondent complètement à un autre contenu ou qui sont sensiblement similaires. Surtout, ce n'est pas trompeur à l'origine.
Le contenu dupliqué est un terme couramment utilisé par les spécialistes du marketing de contenu qui utilisent des techniques de référencement pour promouvoir leurs sites. Le terme fait référence à des situations où différentes pages Web, au sein ou entre des domaines, semblent contenir un contenu très similaire ou identique. Les propriétaires de sites Web sont parfois tentés de copier et coller du contenu sur différentes pages de leur site afin de remplir leurs pages Web.
Tout contenu dupliqué nuira à la campagne de référencement de votre site, car ce type de contenu compromet l'expérience de l'utilisateur. Étant donné que votre objectif ultime est d'atteindre la position numéro 1 sur les pages de résultats des moteurs de recherche (SERP), vos efforts peuvent être vains si vous ne produisez pas un contenu unique, de haute qualité et sans plagiat.
FAIT : La création de contenu améliore les taux d'indexation de plus de 434 %.
Types de contenu dupliqué
En règle générale, il existe deux grandes catégories de contenu dupliqué :
- Contenu dupliqué interne : c'est là qu'un nom d'hôte/domaine a un contenu dupliqué sur le même site Web et possède plusieurs URL internes. Le contenu dupliqué est limité au domaine de votre site Web.

- Contenu dupliqué entre domaines : également appelé contenu dupliqué entre domaines, ce type de contenu se produit lorsque plusieurs domaines ont le même contenu classé par les moteurs de recherche.
Impact du contenu dupliqué sur le référencement
Les experts en référencement savent que les informations qui ont été répliquées sur divers domaines sont rarement axées sur le client. De plus, l'objectif de nombreux moteurs de recherche est de renvoyer des pages de résultats de haute qualité à ses utilisateurs. Si les moteurs de recherche, tels que Google, ne visent pas à répondre aux besoins de leurs utilisateurs, ceux-ci chercheront des alternatives.
Bien que Google n'impose pas de pénalités sur le contenu dupliqué, la campagne de référencement de votre site sera affectée négativement puisque Google filtre les informations identiques ou presque similaires.
Qu'est-ce que cela signifie pour votre site ?
Pour de nombreux experts SEO, le filtrage est une pénalité pour votre site web car c'est une perte d'indexation pour votre contenu web. Indépendamment de qui a produit le contenu, il y a de fortes chances que la page Web d'origine ne soit pas sélectionnée pour être classée dans les meilleurs résultats de recherche de Google.
Selon Dan Petrovic de Dejan Marketing, « s'il existe plusieurs instances du même document sur le Web, l'URL d'autorité la plus élevée devient la version canonique. Les autres sont considérés comme des doublons.
Comment les problèmes de contenu dupliqué se produisent-ils ?
Il existe de nombreuses causes de contenu dupliqué, la plupart d'entre elles étant techniques. Il est crucial que vous identifiiez et corrigiez ces problèmes avant qu'ils ne nuisent gravement à votre classement.
Vous serez intéressé
Tendances de la taille du marché des vêtements de commerce électronique 2021
Pourquoi le référencement organique est important et comment l'obtenir
Quel est le taux de conversion moyen d'un site Web ?
Comparez le référencement de votre site Web avec vos concurrents
Qu'est-ce que le référencement sur la page ?
Comment faire du référencement ?
Outre le contenu copié, voici quelques-unes des principales causes de contenu dupliqué :
Structure des URL
Différents moteurs de recherche ont des règles différentes sur les structures d'URL. Alors que les URL sont sensibles à la casse pour Google, elles ne le sont pas pour Bing.
- Par exemple : https://votrenomdedomaine.com/url-r/ est identique à https://votrenomdedomaine.com/url-R/ pour Bing. Cependant, ces URL sont considérées comme différentes par le moteur de recherche Google.
Vous devez être très attentif lorsque vous créez des liens pour votre contenu. Sinon, une faute de frappe peut empêcher les deux versions de votre URL d'être classées.
Ordre des paramètres
Dans les cas où un système de gestion de contenu (CMS) n'utilise pas une URL propre et agréable, différentes URL peuvent afficher des pages de résultats similaires pour la plupart des sites, mais classées comme uniques sur les moteurs de recherche.
- Par exemple, des URL désordonnées telles que : /?id=3&cat=4 et /?id=4&cat=3 peuvent donner des résultats similaires dans les systèmes de sites Web, bien qu'il s'agisse d'URL différentes pour les moteurs de recherche.
Pages imprimables
Votre site Web contient-il des pages imprimables ? Si oui, créez-vous un lien vers ces pages à partir de vos pages de contenu/d'article ? Il faut se demander laquelle des deux versions voulez-vous vraiment que Google affiche ?
L'établissement de liens vers des pages imprimables peut nuire au référencement de votre site, car Google localise généralement les pages imprimables et les classe comme, vous l'avez deviné, du contenu en double. Voici une bonne illustration pour cela :

(Crédit image : tronicglobal)
Pages d'index
Si la page d'accueil de votre site Web est mal configurée, les internautes peuvent accéder à votre site via plusieurs URL. Une mauvaise configuration se produit généralement à votre insu. Si l'URL de la page d'accueil de votre site Web est https://votrenomdedomaine.com, il est important de noter qu'il est possible d'y accéder via d'autres URL telles que :
- https://votrenomdedomaine.com/index.asp
- https://votrenomdedomaine.com/index.html
- https://votrenomdedomaine.com/index.php
- https://votrenomdedomaine.com/index.aspx
Pour éviter de tels cas, prenez votre temps pour sélectionner la meilleure façon de servir votre page d'accueil.
Testez votre SEO en 60 secondes !
Diib est l'un des meilleurs outils de référencement au monde. Diib utilise la puissance du Big Data pour vous aider à augmenter rapidement et facilement votre trafic et vos classements. Nous vous ferons même savoir si vous méritez déjà d'être mieux classé pour certains mots-clés.
- Outil de référencement automatisé facile à utiliser
- Surveillance des mots-clés et des backlinks + idées
- Vitesse, sécurité, + suivi Core Vitals
- Suggère intelligemment des idées pour améliorer le référencement
- Plus de 250 000 000 membres dans le monde
- Analyse comparative et analyse des concurrents intégrée
Utilisé par plus de 250 000 entreprises et organisations :
Se synchronise avec 
WWW vs NON-WWW ou HTTP vs HTTPS
Bien que ce problème se produise rarement de nos jours, certains propriétaires de sites Web ont encore du mal à diffuser leur contenu. Si vous utilisez HTTPS et le sous-domaine WWW, vous préférez diffuser vos pages Web sous la forme :
https://WWW.votrenomdedomaine.com
Cependant, dans le cas où votre serveur web est mal configuré, vos articles sont accessibles via différentes URL telles que :
https://votrenomdedomaine.com ou http://votrenomdedomaine.com ou http://www.votrenomdedomaine.com
Pages dédiées aux images
Votre site Web affiche-t-il des images sur une page vide ? Eh bien, votre CMS peut parfois créer des pages différentes pour chaque image que vous utilisez sur votre contenu. Parce que ces pages n'ont aucun contenu, elles sont similaires à d'autres pages d'images sur Internet. En tant que tels, ils sont considérés comme du contenu en double par les moteurs de recherche.
Syndication de contenu
Cela se produit assez souvent, surtout si votre site Web est populaire dans un créneau donné. Parfois, des blogs ou des sites proposant des biens et services similaires (tout comme vous) peuvent utiliser votre contenu. Habituellement, la syndication de contenu se produit sans votre consentement, bien que d'autres propriétaires de sites Web puissent demander à utiliser votre contenu pour diverses raisons.
Si le contenu republié ne renvoie pas à votre site, les moteurs de recherche peuvent ne pas connaître la source de l'article.
Pages de résultats de recherche
Votre site Web permet probablement aux visiteurs de rechercher des informations sur votre page d'accueil. Cela signifie que les résultats de recherche affichés sur ces pages sont plus ou moins les mêmes et n'offrent aucune valeur aux moteurs de recherche. Pour éviter cela, il est important que vous ne liiez pas le contenu de votre site Web à vos pages de résultats de recherche.
ID de session
Très souvent, vous souhaiterez peut-être suivre les visiteurs de votre site Web. Pour y parvenir, vous devez donner à vos visiteurs une « session ». Alors, qu'est-ce qu'une séance ?

Une session est l'historique des visiteurs de votre site Web. Il vous indique les activités des visiteurs sur vos sites, comme le nombre d'articles mis dans le panier par rapport à ceux achetés. Pour qu'un site Web maintienne une session lorsque les visiteurs passent d'une page à une autre, un identifiant de session est utilisé.

(Crédit image : tronicglobal)
Les identifiants de session sont généralement stockés sous la forme de cookies. Cependant, les moteurs de recherche ne stockent jamais de cookies. Cela conduit à la confusion des moteurs de recherche entre un identifiant de session et son URL. À son tour, il les perçoit comme un contenu dupliqué.
Comment identifier le contenu dupliqué
Il n'est pas facile d'identifier le contenu dupliqué sur votre site. Pour savoir si le contenu de votre site Web est copié, rendez-vous dans les fiches "rubrique contenu" et "méta informations". Vous trouverez des informations relatives à votre page de titre, à votre méta description et aux rubriques H1.
Pour le contenu dupliqué en dehors de votre site Web, essayez de rechercher du contenu déjà publié sur votre site Web. Par exemple, si vous voulez voir s'il y a du contenu en double pour cet article "Comment éviter le contenu en double", vous pouvez rechercher les mots "Pour le contenu en double en dehors de votre site Web, essayez de rechercher du contenu déjà publié sur votre site Web". Ou "Laquelle de ces solutions est une solution possible pour traiter le problème de contenu dupliqué?" (Utilisé vers la fin de cet article).
Étant donné que vous publierez probablement beaucoup de contenu sur votre site Web, il est conseillé de revérifier votre contenu avec les outils de vérification du contenu en double de Google pour vous assurer que votre contenu est unique. Voici un exemple des résultats que vous attendez de cet outil :


(Crédit image : Moz)
Voici quelques outils que vous pouvez utiliser pour vérifier le contenu en double et gagner du temps.
Nous espérons que vous avez trouvé cet article utile.
Si vous souhaitez en savoir plus sur la santé de votre site, obtenir des recommandations et des alertes personnalisées, analysez votre site Web par Diib. Cela ne prend que 60 secondes.
Copyscape
Copyscape est un outil largement reconnu pour vérifier le contenu en double. Il dispose d'un outil de comparaison qui met en évidence tout contenu en double dans votre texte. La bonne chose avec Copyscape est que l'outil vous donne des résultats en quelques secondes seulement, et vous apprenez à connaître le pourcentage exact de votre texte qui a déjà été publié.
Siteliner
Parfois, vous devrez peut-être vérifier le contenu en double pour l'ensemble de votre site. Siteliner est un excellent outil pour vérifier l'ensemble de votre site non seulement pour le contenu en double, mais aussi pour les liens brisés et pour identifier les pages Web qui sont bien classées par les moteurs de recherche.
Vérificateur de doublons
Duplichecker est un outil qui vérifie votre contenu pour le plagiat. Le site vous permet de vérifier votre contenu dans les recherches DocX, Fichier texte ou URL. Avant de vous inscrire, vous n'êtes autorisé à effectuer qu'une seule recherche gratuite par jour, la limite allant jusqu'à 50 recherches après votre inscription.
PlagSpotter
La recherche d'URL PlagSpotter est efficace, gratuite et fournit des résultats en quelques secondes. Les résultats de votre analyse d'URL incluent des liens vers les sources du contenu dupliqué. En tant que tel, vous pouvez comparer votre texte avec un contenu similaire en ligne.
L'outil peut également surveiller automatiquement votre site Web chaque semaine.
Suppression du contenu en double
Trouver des solutions à votre contenu Web améliorera considérablement le référencement de votre site, en particulier si vous avez une entreprise en ligne. Pour une suppression efficace du contenu en double, voici quelques mesures que vous pouvez prendre.
Supprimer les doublons inutiles
Bien que très chronophage, la première et la plus simple façon de supprimer le contenu dupliqué consiste à réécrire vos informations ou vos articles. Prenez votre temps et lisez un contenu similaire en ligne, il peut s'agir de plusieurs sites Web qui traitent du même sujet, puis mettez les idées que vous avez lues dans vos propres mots. Et n'hésitez pas à ajouter plus d'informations et à utiliser divers dispositifs de cadrage pour vous assurer que le contenu que vous produisez est 100% unique.
Utiliser une redirection 301
Dans quelques cas, il peut vous être impossible d'empêcher complètement votre CMS de créer des URL multiples ou erronées pour votre contenu. Dans la plupart des cas, il est possible de rediriger de mauvaises URL. Une redirection fait passer un navigateur d'une URL à une autre, que ce soit sur le même site Web ou sur plusieurs sites Web. Voici un exemple de redirection 301 :

Vérifier la répétition du modèle
Les longs passe-partout ne doivent pas être utilisés sur différentes pages d'un même site Web. Au contraire, ils doivent être utilisés sur une seule page. Par exemple, plutôt que d'utiliser un long avis de droit d'auteur au bas de chaque page, écrivez un résumé de l'avis et liez-le à une page contenant plus d'informations.
Balise Meta Noindex
Comme indiqué précédemment, d'autres propriétaires de sites Web peuvent copier votre contenu à votre insu. Parce que vous pourriez ne pas éviter que de telles choses se produisent, incluez une petite note sur votre page de contenu, généralement en bas. Demandez à ceux qui pourraient utiliser votre contenu d'utiliser une balise méta "noindex" pour empêcher tout contenu dupliqué d'être classé par Google ou d'autres moteurs de recherche.
Évitez de publier des talons
Que ressentiriez-vous si vous ouvriez une page de site Web et ne trouviez que quelques mots et plusieurs pages vides ? Vous seriez probablement choqué. Dans la plupart des cas, vous constaterez que les propriétaires de sites Web n'ont pas encore publié de contenu sur ces pages. Cela peut être préjudiciable car Google classera toutes les pages vides comme ayant un contenu en double.
Chaque fois que vous souhaitez créer une page d'espace réservé, utilisez toujours des balises méta noindex pour empêcher l'indexation de ces pages.
Utilisez une seule URL
Bien que vous puissiez utiliser plusieurs URL pour créer un lien vers votre site Web, il est important que vous n'en choisissiez qu'une seule. Gardez vos clients à l'esprit lors du choix de votre URL, car votre URL doit être conviviale. Une URL unique permet non seulement à Google de classer votre site Web, mais également à vos utilisateurs de localiser votre site ou une page.
Vous devez définir votre norme préférée sur WWW ou non-WWW. L'idée est d'éviter de créer une confusion chez vos utilisateurs et les moteurs de recherche.
Utiliser une balise hreflang
Une balise hreflang utilise une balise méta de signal HTML qui indique aux internautes la langue et/ou l'emplacement géographique de votre site. Le hreflang est essentiel pour les sites multilingues. Par exemple ce type de tag permet cela :

La prise en charge des utilisateurs non natifs des moteurs de recherche signifie que leur expérience sur votre site est améliorée.
Cependant, si vous avez plusieurs versions d'une même page dans différentes langues, vous devez utiliser des balises hreflang pour informer Google ou d'autres moteurs de recherche de la variation.
Toujours renvoyer au contenu original
Laquelle de ces solutions est une solution possible pour résoudre le problème de contenu en double ? Eh bien, si vous ne pouvez pas vous débarrasser du contenu en double pour diverses raisons, n'oubliez pas d'inclure un lien vers le contenu d'origine. Cela peut être juste en dessous ou au-dessus du contenu dupliqué.
Si les moteurs de recherche rencontrent plusieurs liens d'articles pointant vers votre contenu, ils détermineront que votre contenu est la version originale ou canonique.
Quelle quantité de contenu dupliqué est acceptable ?
Google ne récompense que le contenu unique qui ajoute de la valeur aux clients, ce qui signifie que Google n'accepte aucune duplication de contenu. Cependant, la réponse à la question "quelle quantité de contenu dupliqué est acceptable par Google ou d'autres moteurs de recherche ?" est encore discutable car aucune réponse n'est parfaite. En tant que tel, utilisez toujours un vérificateur de contenu en double de Google et assurez-vous que vos articles sont à 100 % avant de les publier. Voici comment les moteurs de recherche déterminent le contenu dupliqué :

(Crédit image : www.elliance.com)
Diib : améliorez votre classement SEO en évitant le contenu dupliqué
Les experts SEO vous mettront en garde contre le contenu dupliqué – ils ont raison. Bien que le contenu dupliqué se produise presque partout de nos jours, il est important que vous gardiez un œil sur ce que vous souhaitez publier sur votre site si vous souhaitez améliorer votre classement. Le tableau de bord utilisateur Diib est configuré pour repérer tous les cas de contenu dupliqué et vous envoyer une alerte avec les étapes de correction. Voici quelques-unes des fonctionnalités de ce tableau de bord que vous apprécierez certainement :
- Les outils de recherche de mots-clés et de backlink concurrents vous aideront à trouver les mots-clés pour lesquels vos concurrents se classent et à créer du contenu autour de ces mots-clés.
- Des mesures clés, telles que le taux de rebond, le contenu dupliqué et les visiteurs qui reviennent, peuvent maintenir votre site Web en bonne santé.
- Vérifiez comment les abonnés de votre page Facebook aiment le contenu que vous partagez.
- Profitez d'un appel mensuel avec un expert en croissance Diib.
Cliquez ici pour une analyse de site gratuite de 60 secondes ou appelez le 800-303-3510 pour discuter avec un expert en croissance dès aujourd'hui !
