Balise Canonical : Bonnes pratiques et erreurs à éviter

Publié le

La balise canonical vous dit quelque chose ? Ou vous l’avez déjà intégrer sur votre site web mais vous voudriez être sûr que tout fonctionne correctement ?

Balise canonical

Qu’est-ce qu’une balise canonical ?

La balise canonical est un tag HTML qui permet d'indiquer la version principale d'une page. Elle permet d'indiquer l'URL d'une page sur laquelle on souhaite hériter le contenu lorsqu'il est proche ou similaire à une seconde page.

Ce n'est pas la seule fonction qui permet d'éviter le contenu dupliqué.

Il existe également d'autres méthodes pour désindexer des pages. Celle-ci est simplement utilisé dans des circonstances très particulières.

Par exemple, si votre site contient deux pages identiques, et qu'elles sont légitimes à l'être ( ce qui est assez rare mais possible ), alors l'intégration d'une balise canonical est une solution à envisager.

Comment ça marche ?

Grâce à la balise canonical, vous pourrez définir une page canonique en copiant l'URL de la page principale et en la soumettant sur les autres pages.
Dans ce cas précis, Google et les autres moteurs de recherche auront pour directives de ne tenir compte que d'une seule page lors du référencement de ces pages.

Si par exemple, vous avez 10 pages traitant du même contenu :

  • Sélectionnez une seule page parmi les 10 que vous priorisez avant les autres
  • Copiez et collez son URL
  • Insérez-là dans la balise canonical des 9 autres pages

Comment intégrer la balise canonical ?

Intégrer la balise canonical en HTML

Il vous suffit d’inclure une simple balise HTML dans la section <head> de votre page web. Voici la ligne de code à ajouter :
<link rel="canonical" href="page.php">

Intégrer la balise canonical sur WordPress

Le plugin Yoast SEO sur WordPress vous propose notamment de spécifier une URL canonique sur vos pages en cas de contenu dupliqué. Pour ce faire, suivez ces étapes :

  • Rendez-vous sur l’édition de votre page sur WordPress
  • Scrollez jusqu’à Yoast SEO
  • Spécifiez l’adresse originale du contenu dans la section « l’URL canonique »

Vous pouvez également lire la documentation des URL canoniques de Yoast SEO pour en savoir plus.

Spécification sur Yoast SEO de l'URL canonique
Spécification de l'URL canonique sur Yoast SEO

Vérifier la balise canonical

Pour vérifier que la balise est bien intégrée par Yoast, vous pouvez inspecter votre page en HTML et chercher dans la section <head>. La balise devrait normalement être présente !

Exemple résultat HTML de la balise canonical
Exemple résultat HTML de la balise canonical

Par défaut, Yoast inclue la balise canonical sur l’URL de votre page actuelle. C’est à dire que si votre page est unique sur votre site ( et que son contenu n’est pas dupliqué ailleurs ), vous n’aurez pas besoin d’écrire l’URL canonique.

Quel est son impact sur votre référencement ?

Le contenu dupliqué est un problème sur internet car Google ne souhaite pas explorer deux pages identiques et les indexer sur le moteur de recherche.

Pourquoi ?

Voici quelques raisons très simples qui expliquent que le contenu dupliqué est un problème :

  • Les robots d'exploration passent du temps à crawler votre site
  • Pour l'internaute, il y a peu d'intérêt à trouver deux pages identiques sur Google

La balise canonical est un très bon moyen pour traiter le duplicate content.

Cependant, certains référenceurs professionnels recommandent d'utiliser d'autres méthodes que la balise canonical. Parfois, elle est mal interprétée par les moteurs de recherche, ce qui peut nuire à certaines parties de votre site.. Elle est donc à utiliser avec précaution et minimalisme.

Quels sont ses alternatives ?

Afin d'améliorer la qualité de votre site perçu par Google, il est important de respecter certaines préconisations si vous souhaitez traiter le contenu dupliqué.

Pour ce faire, la balise canonical est une solution incontournable, mais cela peut être très long d'indiquer le tag sur chacune des pages de votre site.

Voici quelques alternatives si vous ne souhaitez pas utiliser la balise canonical :

  • Désindexer les pages à contenu dit " doublons "
  • Supprimer les pages à contenu dupliqué
  • Intégrer un code 410 à la page
  • Interdire à Google d'explorer les pages grâce au fichier robots.txt