Le duplicate content ou contenu dupliqué en français est une expression souvent utilisée dans le monde d’internet notamment du référencement et de la rédaction web. Il s’agit habituellement de l’ensemble d’un contenu textuel que l’on retrouve sur deux ou plusieurs pages d’un ou de nombreux sites web différents. On utilise fréquemment le terme plagiat ou vol de contenu pour les sites distincts.
Duplicate content et SEO
Etant un vol, le plagiat est d’un côté sanctionné juridiquement. Cependant, l’auteur doit avoir une preuve de propriété tangible. D’un autre côté, par souci de qualité des résultats naturels de recherche, il est également sanctionné très lourdement par les moteurs. Les sites qui en font risquent de se trouver rétrogradés dans les résultats SEO. Ils peuvent même disparaître complètement dans les recherches. Autrement dit, ils risquent de ne plus se faire référencer par les moteurs. En conséquence, leur présence sur la toile n’aura pas aucun intérêt puisqu’ils ne seront plus visibles par les internautes.
Comment éviter les contenus dupliqués ?
Certes, il est possible que le duplicate content ne soit volontaire si on se fait voler ses contenus ou si on vient de restructurer le site. Pour éviter que cela arrive, on doit faire une vérification systématique des pages de son site. Dans le cas d’une restructuration, on peut se servir des redirections 301 ou « redirect permanent ». Les webmasters peuvent aussi utiliser des outils en ligne comme Google Webmaster tools. Ce dernier indique le cas de duplicate content qu’il détecte sur la plateforme. Pour ceux qui doivent en faire pour des raisons techniques (site qui doit avoir les mêmes contenus dans certaines de ses pages), la solution efficace est l’usage des urls canoniques. Ces derniers permettent aux moteurs de détecter plus aisément les pages mères. Pour ceux qui achètent des contenus chez des fournisseurs, le contrat doit contenir des clauses indiquant que les contenus livrés soient originaux et exclusifs.