Le contenu dupliqué, votre pire ennemi

Les contenus dupliqués sont considérés comme étant les ennemis numéro un du référencement. C’est d’ailleurs pour ça qu’il est toujours conseillé de faire appel à des contenus jugés uniques lors de leur édition.
Certaines personnes pensent à tort qu’il leur est possible de poster impunément des contenus dupliqués sur leur site. Alors que cela peut s’avérer très dangereux si les moteurs de recherche s’en aperçoivent.

Quand est-ce qu’un contenu est considéré comme étant dupliqué ?

Un contenu est estampillé « dupliqué » à partir du moment où le contenu ou une partie de ce contenu se retrouve indexé à différents endroits du web.
Pour être plus précis, un contenu dupliqué est un contenu que l’on peut retrouver en partie ou intégralement à partir de différentes URL.
Le contenu dupliqué s’oppose au contenu dit unique qui n’est indexé qu’à une seule URL par les moteurs de recherche.
Il existe deux types de contenus dupliqués : les contenus dupliqués internes et les contenus dupliqués externes.
On parle de contenu dupliqué interne lorsque le contenu incriminé se retrouve à être indexé par deux URL certes différentes, mais qui se rattachent au même site web.
Ce n’est pas le cas le plus grave en matière de contenu dupliqué encore, qu’il s’agisse généralement d’erreurs techniques ou d’inattention. Les cas les plus fréquents sont :

  • la publication du même contenu sur un site en deux versions avec deux URL différentes, une pour ordinateur de bureau et une pour mobile ;
  • une mauvaise refonte de l’arborescence d’un site ;
  • et la publication de descriptions identiques sur différentes fiches produits. Les contenus dupliqués externes sont beaucoup plus problématiques. Il s’agit surtout des cas de plagiats qui sont généralement considérés par les moteurs de recherche comme étant faits délibérément. Dans certains cas, les contenus dupliqués peuvent être dus à un concours de circonstances. Particulièrement quand deux sites différents traitent des informations similaires en s’appuyant sur les mêmes sources.

  • Quels sont les risques encourus en utilisant des contenus dupliqués ?

    Les contenus dupliqués ne sont ni bons pour les moteurs de recherche ni bons pour les internautes se servant de ces moteurs de recherche.
    Pour un moteur de recherche, indexer, un contenu coûte de l’argent et demande un certain temps.
    Or en indexant du contenu dupliqué, cet effort fourni devient tout simplement inutile et constitue donc une perte pour le moteur de recherche.
    Pour l’utilisateur, le problème est en rapport avec la variété des informations. Il ne sert à rien d’avoir plusieurs sources qui apportent les mêmes informations.
    Pour éviter de gaspiller l’énergie de leurs robots référenceurs, les moteurs de recherche mettent en place un système qui pénalise les sites qui relaient régulièrement les contenus dupliqués.
    Il s’agit d’un algorithme qui permet de déterminer les contenus dupliqués et de classer ces contenus en queue des résultats des recherches en rapport avec le contenu.
    L’algorithme a également la possibilité de déterminer si la duplication de contenu a été faite volontairement. Là, c’est tout le site qui risque d’être déclassé dans les recherches.
    Parfois même, le site peut tout simplement être non classé par le moteur de recherche, peu importe si les mots-clés de recherche ont rapport avec ce dernier.

    Que faire pour lutter contre les contenus dupliqués ?

    La lutte contre les contenus dupliqués est avant tout un ensemble de bonnes pratiques à adopter au quotidien. Ainsi, il est conseillé d’adopter les mesures suivantes.

  • Vérifier régulièrement les différentes pages du site internet afin de voir si par hasard il n’y a pas d’erreur qui ait pu se glisser dans l’une d’entre elles.
  • Se référer régulièrement aux rapports d’erreurs établis par Google Search Console.
  • Durant la refonte de l’arborescence d’un site, mettre en place des redirections 301 permanentes afin d’indiquer clairement aux robots quelles pages peuvent être indexées.
  • Exiger des éditeurs de contenus d’éviter au maximum les contenus dupliqués.
  • Faire l’effort d’aller régulièrement sur le web afin de s’assurer que les contenus du site n’ont pas été plagiés par d’autres sites.
    Certains outils peuvent aider à remplir ces tâches importantes pour le bon référencement d’un site internet. Vous avez par exemple Screaming Frog. Il s’agit d’un outil dont le fonctionnement permet d’identifier sur un site internet les contenus dupliqués à l’intérieur même de ce dernier. En alternative, il y a KillDuplicate. C’est un outil qui permet de faire le traçage des sites qui ont repris vos contenus pour en faire leurs propres contenus.
    Pour finir, il y a évidemment la Console Search de Google. C’est un outil que Google met à disposition des sites. Pour y avoir accès, il faut se rendre au niveau de l’index, puis se rendre dans « Exclues » et là vous allez retrouver les URL écartées pour contenus dupliqués.