De nombreux spécialistes du marketing de contenu tremblent à l’idée d’un contenu dupliqué, et ce, pour une bonne raison. Le duplicate content ne contribue jamais à une expérience idéale sur votre site, ni à votre capacité de classement.
Mais le fait est que beaucoup de gens ont du duplicate content sur leurs sites, et ce n’est généralement pas intentionnel ou malveillant d’une manière ou d’une autre.
Ce n’est pas une raison pour paniquer, mais c’est une raison pour prendre des mesures correctives, car le contenu dupliqué peut avoir un impact sur votre référencement (mais pas de la façon dont vous pourriez le penser).
Poursuivez votre lecture ci-dessous pour en savoir plus sur le contenu dupliqué, sur la façon dont Google le considère.
Qu'est-ce que le duplicate content?
En termes simples, le duplicate content est un bloc de contenu substantiel qui se trouve à plusieurs endroits sur Internet, que ce soit sur plusieurs pages de votre propre site Web ou sur deux ou plusieurs domaines différents.
Le contenu dupliqué désigne en outre un contenu qui correspond complètement à l’autre contenu ou qui lui est très similaire. Ainsi, même si le contenu n’est pas exactement formulé, il peut être considéré comme un contenu dupliqué s’il est suffisamment proche.
Google pénalise-t-il votre site Web en cas de contenu dupliqué ?
De nombreuses personnes ont l’impression que Google pénalise un site Web en cas de contenu dupliqué. Au contraire, Google lui-même a confirmé qu’il ne pénalise pas les sites Web dont le contenu est dupliqué, sauf dans de rares cas où vous essayez de jouer avec l’algorithme.
Cependant, le contenu dupliqué a toujours un impact sur votre classement dans les moteurs de recherche et peut nuire à vos efforts de référencement.
(P.s. Si vous vous demandez si cette citation en bloc déclenche des avertissements de « contenu dupliqué », n’ayez crainte. Cet élément utilise une balise HTML blockquote que Google peut lire et comprendre comme une citation par rapport au texte que nous incluons généralement dans un article).
Pourquoi le duplicate content est un facteur important ?
Il y a plusieurs raisons pour lesquelles le contenu dupliqué est important pour les moteurs de recherche. Mais avant de nous plonger dans les détails, il est important de comprendre l’objectif d’un moteur de recherche.
L’objectif principal de tout moteur de recherche est de fournir à ses utilisateurs des sites Web et des informations précises pour leur requête. Les moteurs de recherche y parviennent en examinant les pages ayant une URL unique et en explorant le contenu de cette page.
Ainsi, si deux URL partagent le même texte et les mêmes informations, comment Google choisit-il la version de ce contenu à afficher ?
Si vous vous grattez la tête en essayant de trouver la réponse, c’est que vous savez exactement ce que ressentent les moteurs de recherche lorsqu’ils rencontrent du contenu dupliqué. Le contenu en double les perturbe tout simplement.
Pour être plus précis, voici les trois principaux problèmes que le duplicate content pose aux moteurs de recherche :
- Lorsque du contenu en double est présent sur votre site Web, les moteurs de recherche ne savent pas quelle version du contenu inclure ou exclure de leurs index.
- Les moteurs de recherche ne sauront pas s’il faut diriger le « jus » des liens (par exemple, la confiance, l’équité des liens, etc.) vers une page ou le garder séparé entre plusieurs versions. Si le jus de lien est réparti entre plusieurs pages de votre site, vous compromettre vos chances d’obtenir un meilleur classement pour votre mot clé cible.
- Comme décrit ci-dessus, ils ne sauront pas quelle version du contenu affiché ou classer pour une requête de recherche.
- Vos pages au contenu similaire sont essentiellement en concurrence les unes avec les autres pour attirer l’attention de Google. En général, les pages qui ont le plus de trafic et d’équité en matière de référencement (c’est-à-dire d’autorité) seront prioritaires dans les moteurs de recherche, et la ou les autres pages avec du contenu dupliqué n’apparaîtront pas du tout dans les SEPR car le moteur de recherche ne voudra pas afficher deux pages avec le même contenu pour la même requête.
Une remarque sur le contenu "tournant" (spinning)
Attention : Google pénalise effectivement votre site Web si vous diffusez du contenu de manière automatique, parce qu’il considère que le contenu généré automatiquement est trompeur et n’est pas destiné à aider l’utilisateur, mais uniquement à des fins de référencement.
Ainsi, lorsque vous réécrivez votre contenu, veillez à ne pas « filer » le contenu et assurez-vous que le nouveau contenu est unique.
Causes courantes/normales du contenu dupliqué
Il arrive souvent que vous soyez surpris de trouver des pages dupliqués sur votre site. Cela peut se produire pour plusieurs raisons :
- Les pages de produits de commerce électronique : De nombreux sites de commerce électronique ont des soucis d’avoir des problèmes SEO pour les descriptions partagées entre plusieurs variantes de produits (qui ont toutes leur propre URL), ou utilisent la description d’un fabricant pour les produits qu’ils vendent (ainsi que de nombreux autres détaillants).
- Catégorisation du CMS : Alors que les moteurs de recherche considèrent les URL comme l’identifiant unique d’une page, les systèmes de gestion de contenu (CMS) peuvent attribuer un identifiant unique à leur base de données. C’est pourquoi un article peut être stocké sous les URL « www.site.com/title » et « www.site.com/category/title » qui sont toutes deux captées par les moteurs de recherche (bien que les développeurs affirment que tout cela renvoie à un seul élément de votre base de données).
- Paramètres d’URL ou ID de session : Si vous ajoutez des balises de suivi à la fin de vos URL, vous créez essentiellement des URL uniques qui renvoient au même contenu. Les balises de suivi sont couramment utilisées par les stratèges de contenu qui souhaitent analyser le trafic, et par les sites de commerce électronique qui utilisent des identifiants de session pour suivre les visiteurs et leur permettre de stocker des articles dans un panier (par exemple). Vous ne souhaitez pas nécessairement abolir ces pratiques, mais vous voulez contrôler leur utilisation.
- Versions imprimables : Si votre CMS crée des versions imprimables de vos pages, les moteurs de recherche peuvent découvrir et considérer ces deux URL comme du contenu dupliqué.
- Pagination : Si vous décidez de paginer les pages de catégories ou les commentaires au sein d’une page, il est possible de se retrouver avec des éléments en double sur plusieurs pages avec des URL uniques.
- Http vs. Https : si les URL http et https sont toutes deux actives – ou si des versions de votre URL avec et sans le préfixe « www » sont actives – vous avez alors deux pages distinctes avec un contenu partagé.
Le contenu est le ROI
Parce que cette citation est véritable, il faut que vous prenez soin de votre contenu, notre agence SEO Paris vous conseille d’appeler une agence référencement naturel, afin de créer un contenu unique et de qualité, Google change ses algorithmes souvent, mais le contenu reste toujours le ROI et l’élément le plus important pour le référencement de votre site.