« Retour au glossaire

La balise canonical, déclarée par l’annotation rel=canonical, indique aux moteurs de recherche quelle est la version de référence d’une page lorsqu’un même contenu est accessible via plusieurs URL. Elle sert à gérer les contenus dupliqués et à concentrer les signaux SEO sur une seule adresse. Point important : c’est une indication forte, mais pas une règle absolue, Google pouvant retenir une autre version selon ses propres signaux.

Qu’est-ce que la balise canonical ?

La canonicalisation est le processus par lequel un moteur choisit une URL représentative parmi un ensemble de pages identiques ou très similaires. La balise rel=canonical, placée dans l’en-tête HTML d’une page, désigne l’URL que l’on considère comme la version maîtresse. Les autres versions restent accessibles, mais c’est la canonique qui est privilégiée dans les résultats.

Le problème des contenus dupliqués

Un même contenu se retrouve souvent sur plusieurs URL sans intention de nuire : versions http et https, avec ou sans www, paramètres de suivi, pages de tri et de filtres, ou variantes d’impression. Ces doublons dispersent les signaux et font perdre du temps d’exploration. La canonical permet de regrouper ces variantes autour d’une seule adresse de référence.

Comment Google choisit la page canonique

Google s’appuie sur plusieurs signaux, par ordre de force : les redirections, puis l’annotation rel=canonical, puis l’inclusion dans le sitemap. Il prend aussi en compte le protocole et les liens internes, avec de nombreux signaux au total. Comme ces indications peuvent se renforcer, mieux vaut les aligner. Et puisque la canonical reste une suggestion, Google peut désigner une autre page s’il la juge plus pertinente.

Comment l’implémenter

  • Placer la balise rel=canonical dans l’en-tête HTML, pointant vers l’URL de référence.
  • Utiliser une canonical auto-référente sur les pages uniques, qui pointent vers elles-mêmes.
  • Lier en interne vers la version canonique, de façon cohérente.
  • Faire pointer la canonical vers une URL finale, jamais vers une page qui redirige.
  • Pour fusionner définitivement des doublons, préférer une redirection 301, signal plus fort.

Canonical, budget de crawl et indexation

La page canonique est explorée plus régulièrement, les doublons moins souvent, ce qui allège la charge d’exploration. Bien gérée, la canonicalisation aide donc à préserver le budget de crawl et à clarifier l’indexation. Google déconseille en revanche d’utiliser le robots.txt à cette fin, car une page bloquée peut quand même être indexée sans son contenu.

Les erreurs courantes

Les pièges fréquents sont des signaux contradictoires entre canonical, sitemap et liens internes, une canonical pointant vers une page en noindex ou vers une URL qui redirige, ou une balise placée hors de l’en-tête. La cohérence est la clé : un audit technique régulier permet de détecter et corriger ces incohérences avant qu’elles ne brouillent l’indexation.

À retenir

  • La balise canonical désigne la version de référence d’une page parmi des doublons.
  • C’est une indication forte, mais pas une règle : Google peut choisir une autre version.
  • Les doublons viennent souvent des variantes http/https, www, paramètres et filtres.
  • Les signaux, par ordre de force : redirections, rel=canonical, inclusion au sitemap.
  • Elle doit se trouver dans l’en-tête HTML et pointer vers une URL finale, non redirigée.
  • Elle aide à préserver le budget de crawl et à clarifier l’indexation.

Pluvian audite la gestion des doublons et la canonicalisation des sites B2B dans son accompagnement SEO technique. Pour un diagnostic, échangez avec l’agence.

Voir aussi : Indexation, Redirection 301, Budget de crawl, Sitemap XML, Crawl et exploration.

Synonymes :
Canonical, rel canonical, URL canonique
« Retour au glossaire