Bien plus qu'un hébergeur !

Chaque jour, Google doit faire face à des milliers de nouveaux contenus (bons et moins bons), mais explorer toutes ces nouvelles pages a un coût !

Ça y est, nous y sommes…

L’Indexation de sites sur Google est devenue beaucoup plus stricte en 2021 !

Au sommaire

Depuis quelques semaines, toute la communauté du Web francophone se pose des questions, nous y compris. 

Indexation Google LaWebeuse sur Twitter

Les délais d’indexation sont croissants, ou en tout cas aléatoires.

Conversation sur la non-indexation d'un article de blog

Google nous avait pourtant habitués à être indexés quelques heures après la publication de nos jolis contenus.

Lorsqu’on est seul face à sa console Google Search, on peut paniquer…

Mais comme vous le voyez, vous n’êtes pas seul !

Dans cet article, nous allons parler de crawl (ou d’exploration en français). Nous découvrirons quelques affirmations officielles partagées notamment par John Mueller (spécialiste Google Search, voir photo ci-dessous).

Conférence du 9 juillet 2021 de John Mueller

Source : webconférence du 9 juillet 2021 sur l’indexation Google (John-Mueller)

Posez-vous et apprêtez-vous à prendre des notes…
Cet article est un condensé d’information et même, une véritable formation sur l’indexation Google !

Nous verrons plus loin que les délais d’indexation des pages sont en train de devenir beaucoup plus longs qu’à la belle époque “Google Caffeine” (2010). En tout cas, c’est le cas pour les sites de petite et moyenne envergure. 

Google devient de plus en plus exigeant et c’est tant mieux pour ceux qui visent la qualité !

Google change ses habitudes d’exploration et donc, ses délais d’indexation

Cela n’est pas étonnant et on pourrait même dire : il était temps !

Dans le passé, Google avait l’habitude d’explorer (et d’indexer) un peu tout et n’importe quoi ; en un temps record ; sans prendre le temps de beaucoup réfléchir en amont. C’est d’ailleurs la raison pour laquelle, encore aujourd’hui, les référenceurs black hat continuent d’user de splogs, de spinning et de cloaking. Des pratiques toutes aussi inutiles les unes que les autres, pour le lecteur final, qui se retrouve généralement redirigé vers un site sans le moindre rapport avec sa recherche. 

Pourquoi blâmer les référenceurs black hat ?

Tant qu’elles permettent de générer du trafic (rien qu’un peu), ces méthodes de spam automatique continueront d’être utilisées.

De toute évidence, à la base, le but de Google était d’avoir l’index le plus large possible.

Les origines de l'indexation Google en 1998

Aujourd’hui, Google évolue vers un index le plus qualitatif possible et il en profite pour faire des économies sur les ressources d’exploration (le crawl) nécessaires pour indexer le Web. Des économies de ressources serveur qui seront utilisées pour favoriser les sites de bonne qualité, autant par leur contenu que l’excellente expérience dont bénéficient leurs utilisateurs. 

C’est Google qui le dit !

Dans cet article, nous allons émettre beaucoup d’hypothèses et dresser la liste des 18 actions à mettre en place pour vous assurer une bonne indexation Google. Mais avant cela, analysons directement les déclarations des principaux intéressés, à savoir, les ingénieurs qui travaillent chez Google Search.

La première révélation partagée par Google nous en dit long sur les changements qui s’opèrent en ce moment…

Bienvenue au Predictive Crawling !

Grâce à l’exploration prédictive (et sélective), faire des économies sur les ressources d’indexation est très simple pour Google. Il lui suffit d’explorer certaines pages moins souvent, en adaptant de façon prédictive :

  1. sa fréquence d’indexation des nouveaux contenus
  2. sa fréquence de mise à jour des contenus déjà indexés

Grâce à l’intelligence artificielle (machine learning), il se base sur ce qu’il connait déjà concernant le site ciblé : ses habitudes de publication, la qualité de son contenu, etc.

On peut comprendre Google…

Inutile de vérifier le blog du voisin 5 fois par jour, alors qu’on le sait… il publie à peine tous les 6 mois un article de mauvaise qualité ! 😀

Google Search est le roi des algorithmes.

Source : Google, Predictive Crawling - 6.2 Resource Savings

Source : Google, Predictive Crawling – 6.2 Resource Savings !

En utilisant la fréquence d’exploration prédictive, sur la plupart des sites, Google pourrait économiser ~ 50% de ressources, sans pour autant rogner sur la qualité de son index, que du contraire !

Google utilise l’intelligence artificielle pour décider s’il doit explorer une page et quand ! 

Déjà le 11 novembre 2020, Martin Splitt (ingénieur chez Google Search), laissait entrevoir que Google allait faire le tri, entre les pages potentiellement intéressantes à explorer, ou non ; les pages urgentes à indexer, ou non. Le tout en se basant sur le machine learning (ou l’intelligence artificielle). 

Quality Predictive dans Google Search selon Martin Splitt

Voici les commentaires de Martin Splitt.

Au sujet de la qualité présumée et prédictive d’un contenu…

« Nous utilisons l’intelligence artificielle pour identifier ou prédire ce que nous obtiendrons d’un crawl en termes de qualité ».

Dans cette petite webconférence de 30 minutes, Martin nous dit qu’il est intéressant pour Google d’essayer de « prédire le niveau de qualité qu’il pourra obtenir d’un crawl spécifique, avant même qu’il ne se produise ». Cela permettrait à Google de « planifier l’exploration plus intelligemment ».

C’est vrai, après tout…

Google sait si un site est de bonne qualité ou non. Google a les moyens de prédire quels liens vaudront la peine d’être explorés. Google doit-il donc s’embêter à utiliser (de toute urgence) des ressources pour explorer toutes les URLs du Web ?

Si oui, pourquoi faire ? Nous faire plaisir !? 😀

Au sujet de la fraîcheur présumée…

Martin Splitt nous dit qu’il en est de même pour la fraîcheur des contenus « pouvons-nous prédire qu’il est très utile d’explorer ce site quotidiennement, ou pouvons-nous collecter des signaux qui nous font penser que nous aurions tort de le visiter quotidiennement ».

Ainsi, Google peut utiliser l’IA et le machine learning de façon prédictive, en particulier pour les sites où le contenu ne change pas régulièrement.

En novembre 2020, l’ingénieur précisait « je ne sais pas si nous utiliserons ça en production… pour l’instant, il s’agit d’un essai ».

Ces changements de vitesse d’indexation sont encore récents !

Tout cela pourrait expliquer les comportements un peu « aléatoires » de l’indexation Google en ce moment.

Combien de temps prend l’indexation d’une page sur Google  ?

L’indexation d’un nouveau contenu peut prendre des heures, voir des semaines et c’est Google qui l’a dit dans une vidéo du 30 juin 2021 :

Combien de temps pour indexer une page sur Google ?

Google a toujours été très clair sur le sujet : la qualité est l’aspect le plus important pour pousser Google à rapidement indexer et à positionner une page !

Dans cette vidéo, c’est notre ami John Mueller qui nous parle (actuel représentant numéro 1 chez Google Search).

Combien de temps faut-il pour référencer un site sur Google ?

Comment fonctionne l’indexation de nouveaux contenus sur Google ?

Comme toujours, John Mueller commence par nous rappeler que l’indexation n’est pas garantie par Google. Google n’a pas vocation à indexer absolument tout le contenu disponible sur Internet. Par exemple, Google évite le contenu dupliqué et les pages inutiles ou redondantes (comme les fiches e-commerce et tous leurs filtres de Taille, de Couleur, etc).

De même, votre site peut être indexé, mais rien ne dit que vos pages seront bien classées dans les résultats de recherche.

« Cela peut prendre plusieurs heures à plusieurs semaines pour que Google indexe un nouveau contenu, ou qu’il effectue la mise à jour d’un contenu ayant été modifié ».

« Si cela prend encore plus de temps, cela peut être lié à des problèmes techniques avec votre site Web, ou parce que GoogleBot est occupé à faire d’autres choses, comme indexer des sites plus importants. C’est variable ».

Deux poids, deux mesures.

Les gros sites d’actualités n’ont pas à s’en faire. Leurs contenus peuvent toujours être indexés en quelques minutes…

Quoi de plus normal lorsqu’on dispose d’une équipe de rédacteurs qui ajoutent quotidiennement plusieurs news à son site ?

Comment accélérer l’indexation des pages selon John Mueller ?

Combien de temps faut-il pour indexer un site sur Google ?

  1. empêchez la surcharge du serveur Web
  2. optimisez la vitesse de chargement du site
  3. faites des liens visibles vers vos nouveaux contenus (depuis votre page d’accueil, etc)
  4. évitez de laisser crawler des pages inutiles telles que les URLs d’un calendrier infini et des filtres de recherche e-commerce
  5. utilisez les méthodes de soumission d’URLs offertes par Google, comme le plan de site XML (sitemap) ou l’outil d’inspection d’URL pour l’indexation d’URLs individuelles
  6. faites du bon contenu et maintenez un site de haute qualité

Autrement dit, faites en sorte que Google vous apprécie, pour qu’il donne la priorité à l’indexation de votre site, car c’est la première étape avant de pouvoir recevoir du trafic organique : pas d’indexation, pas de positionnement !

Comme vous le voyez, même si les algorithmes de Google évoluent constamment, son discours lui n’a pas changé en 20 ans. Faire un meilleur contenu et maintenir un site de meilleure qualité que le voisin, c’est la voie royale pour lui passer devant sur Google… et y rester !

L’hébergement Web est très déterminant pour l’indexation SEO !

“ Les modifications apportées à la structure et l’infrastructure de votre site peuvent déclencher une baisse importante de la fréquence d’indexation sur Google ! ”

Boom !

La bombe a été lâchée il y a quelques jours, le 13 juillet, dans une webconférence officielle de Google où John Mueller répondait encore une fois à nos questions.

Webconférence avec John Mueller

Sur la vignette, c’est une utilisatrice, pas John Mueller.

Durant cette conférence, John Mueller a répondu à plusieurs utilisateurs. L’un d’eux expérimentait une baisse du taux d’exploration après avoir apporté des changements à la structure de son site Web. Dans ce cas précis, l’utilisateur venait simplement d’installer un CDN sur son site, pour en améliorer la vitesse de chargement.

En effet, si votre site Internet est d’envergure internationale, il peut être intéressant d’y configurer un CDN, comme celui de l’excellent KeyCDN que nous recommandons à nos clients.

Suivez notre lien et bénéficiez de 10$ de crédits offerts sans engagement à la création d’un compte sur KeyCDN.

Un service de livraison de contenu tel qu’un CDN est un réseau de serveurs répartis dans le monde entier dont l’objectif est d’accélérer la livraison des fichiers du site Web, en sélectionnant à chaque fois le serveur le plus proche du visiteur.

Grâce au CDN, Google devrait donc être en mesure de visiter le site (et l’indexer) encore plus rapidement.

Déclaration sur l'indexation Google par John Mueller

Cette fois-ci c’est John Mueller qui nous parle.

John Mueller a répondu à cet utilisateur que « l’indexation pouvait drastiquement être ralentie, pendant quelque temps, suite à ce genre de changement de structure technique. Installer un CDN ou changer de fournisseur est une modification majeure aux yeux de Google ».

« Si vous modifiez l’infrastructure qui héberge votre site Web, nous modifierons temporairement nos habitudes d’exploration. »

« Nous sommes prudents et nous ne voulons pas causer de problèmes pendant que vous effectuez des travaux sur votre site. Plus tard, lorsque nous constatons que la situation est redevenue stable, nous reprenons nos habitudes d’exploration pour votre site ».

Apparemment, Google fait ça pour éviter de nous causer des ennuis, ainsi qu’à ses utilisateurs ?

« Changer de fournisseur CDN est une modification importante dans l’infrastructure de votre site. Nous détectons ce changement et nous suspendons l’exploration pendant un certain temps. Ensuite, nous reprenons lorsque tout est rapide. »

L’intérêt d’une baisse de l’indexation, pendant ces travaux, serait de nous faciliter la mise à jour de notre site.

Croyons Google sur parole.

Parfois, un site qui déploie une mise à jour majeure peut subir quelques changements imprévus, sur un laps de temps allant de quelques jours à quelques semaines. Par exemple : on laisse s’indexer une catégorie qui n’était pas prévue ; certaines balises canonical ont été oubliées ici ou là, etc. 

L’indexation d’une nouvelle version de site qui ne serait pas encore totalement aboutie (donc, pas prête à être indexée ou rafraichie dans l’index de Google), cela pourrait entraîner une confusion irréversible pour vous, dans le classement de vos pages et pour les utilisateurs, qui se verraient redirigés vers des pages potentiellement “en construction”.

Un mal pour un bien.

Dans le cas de travaux techniques, il peut être bénéfique que Google ralentisse son exploration, afin d’éviter l’indexation de tout et n’importe quoi et surtout, la désindexation de vos meilleures pages (celles déjà positionnées). Ce qui serait lourd de conséquences.

Il y a un temps pour la création de contenu et un temps pour la technique.

Effectivement, on notera que, dans la même période que son changement de CDN, la personne ayant subi cette baisse d’indexation a aussi déclaré « avoir effectué beaucoup de redirections de pages, pour en changer leurs adresses URLs ».

Rappelons que Google ne se contente pas de parcourir le Web en suivant les liens. Il garde aussi un historique de tous les signaux du passé, comme les mots clés utilisés ou la fréquence à laquelle une page est mise à jour. 

Réfléchissez bien au contenu que vous allez publier sur votre site, car tôt ou tard, il sera nécessaire de, soit le mettre à jour (l’actualiser), ou soit le supprimer (pour éviter d’héberger trop de contenus de faible qualité).

Les problèmes d’indexation ne sont pas à prendre à la légère.

Ceux-ci peuvent s’avérer temporairement préjudiciables, car sans indexation Google, pas de trafic naturel !

De même, si un problème technique pousse Google à désindexer certaines pages qui contribuaient à l’acquisition de nouveaux clients, la perte financière peut avoir un impact majeur sur votre entreprise.

Tiens tiens, qu’est-ce que Google Ads vient faire ici ?

Google Ads, anciennement Google AdWords, c’est la régie publicitaire de Google. C’est là que les entreprises se ruinent pour acheter des clics et obtenir plus de clients depuis les résultats de recherche, sans avoir à faire de référencement naturel 😀

Google Search et Google Ads ont un point commun de taille !

Ces 2 services vous offrent une porte d’entrée sur les pages de résultats de recherche.

Les meilleurs hébergeurs cPanel

Les Meilleurs Hébergeurs cPanel indexés sur Google. En orange, la publicité. En bleu, les résultats naturels.

Que cela soit via Google Ads ou grâce au SEO, pour rentrer chez Google, il y a des règles à respecter. 

L’hébergement Web est aussi très déterminant pour être validé sur Google Ads !

Sur Google Ads aussi, il y a des problèmes d’indexation… oui oui !

Un problème comparable à celui évoqué pour Google Search se pose aussi très fréquemment sur Google Ads !

Dans la même logique, Google Ads aussi souhaite fournir des résultats et des liens de qualité, autant via le Search que via les publicités. Après tout, ce sont ses fidèles utilisateurs qui font des recherches sur Google et il ne veut pas perdre sa clientèle. 

Votre site se doit donc d’être au top, aussi bien au niveau contenu, qu’expérience utilisateur et technique. Sinon, voici le genre de message d’erreur que vous pourriez recevoir lorsque vous cherchez à soumettre l’URL de votre site dans une campagne Google Ads :

  • Page de destination inaccessible.
  • Destination impossible à explorer.
  • Différence entre l’annonce et sa destination, etc.

Google Ads et Google Search : page de destination inaccessible !

Ce genre de refus d’URL est extrêmement fréquent sur Google Ads.

Au moindre problème avec votre page de destination, vous en serez averti par l’algorithme de Google Ads en moins de 30 minutes.

C’est beaucoup plus rapide que la console Google Search n’est-ce pas ?

En cas de doute concernant une URL, vous pourriez très bien tenter de créer une annonce Google Ads avec un budget de 5 euros, pour voir ce qu’il se passe.

Si l’URL est refusée, vous avez toutes les raisons de vous poser des questions !

Page de destination inaccessible (destination not working)

Cette erreur est l’une des plus fréquentes et pourrait bien vous rendre fou si vous veniez à l’expérimenter. 

Cela signifierait que Google ne peut pas accéder à votre page, mais dans les faits, c’est beaucoup plus complexe que cela. 

Tout d’abord, il faut savoir que Google exige que votre page de destination puisse être visitée par n’importe quel pays du globe, même les pays qui sont très éloignés des utilisateurs que vous ciblez avec votre publicité. 

En plus de cela, votre page doit se charger rapidement… même à l’autre bout de la planète.

En prime, la page doit être rapide et conviviale, même sur mobile avec une connexion réseau douteuse, oui oui ! 

Si vous contactez Google au sujet d’une page de destination inaccessible, voici ce qu’il pourrait vous répondre :

Google ads page de destination inaccessible, destination not working : la solution

C’est du vécu 😉 

Même si vous partagez des exports de tests de performance Uptrends issus de dizaines de pays et qui attestent que votre page se charge en moins de 3 secondes à l’autre bout de la planète, Google Ads peut ne pas s’en satisfaire. Sous prétexte d’un test effectué via un outil interne, on pourrait vous répondre que sur mobile, au fin fond du Brésil et à Singapour, votre page met plus de 5 secondes à se charger

Dans un précédent contenu sur l’optimisation de WordPress, pour des raisons de sécurité, nous vous suggérions de bloquer l’accès à votre site pour certains pays dont le trafic pouvait être à risque et les comportements malicieux (Russie, Chine, etc).

Fort de ces nouvelles informations, nous avons changé d’avis ! 

D’ailleurs, contrairement à certains hébergeurs concurrents, aucun pays n’est blacklisté sur les infrastructures d’EasyHoster. Nos dispositifs de sécurité (firewall, anti-DDoS, etc) sont bien plus évolués que cela. D’ailleurs, nous avons beaucoup de clients qui opèrent depuis l’Afrique ou même l’Asie.

Les conclusions du bot de Google Ads sont-elles fiables ? 

Observez ce test de temps de réponse serveur (TTFB) :

L'importance du TTFB dans le monde

Il s’agit d’un résultat assez classique pour un site WordPress hébergé sur un serveur Web haute performance localisé en France.

Comme vous pouvez le voir (entouré en vert), chez nos voisins allemands, hollandais et anglais, le TTFB est excellent (sous la barre des 100 ms). En revanche, à San Francisco, où se situe le siège social de Google USA, le TTFB est de 602 ms. Sans parler de l’Australie et du Japon où les TTFB sont catastrophiques, plus d’1 seconde !

On constate ici que nous ne sommes pas sur un problème d’optimisation du site Internet (plugins WordPress, etc), ni même sur un manque de ressources serveur (CPU, RAM…), mais bien sur une contrainte « réseau ». 

Heureusement, il y a des solutions.

Elles sont parfois longues et complexes, mais elles existent.

D’ailleurs, vous comprenez maintenant l’intérêt de souscrire à un service de CDN tel que KeyCDN (efficace et pas cher) en complément d’un excellent hébergement Web, et ce, même si vous ne ciblez pas de visiteurs brésiliens, australiens ou japonais.

Comment résoudre tous les problèmes d’indexation Google ?

La suite de cet article a pour but de vous donner toutes les pistes possibles, pour mettre toutes les chances de votre côté, afin de bénéficier d’une fréquence d’indexation optimale pour votre site.

Quels types de contenus sont majoritairement concernés ?

Nous avons remarqué que les problèmes de fréquence d’exploration et d’indexation Google touchent particulièrement les pages de catégories (archives, pagination, etc), dont la seule vocation est de fournir une liste de liens internes, sans autres contenus et donc, sans réelle valeur ajoutée. Voir exemples d’URLs ci-dessous.

Les pages de catégories non-indexées sur Google

Un rapport similaire peut aussi être trouvé en cliquant dans la liste des « Sitemaps envoyés ».

Le sitemap dans la Google Search Console

Si vous êtes en train d’alimenter votre site et que vous avez déjà créé près de 30 catégories dans votre base de connaissances, il peut être intéressant de dépublier les catégories peu fournies (Brouillon) ou au moins, ajouter une balise robots=noindex, avec un plugin SEO tel que Yoast.

Bien sûr, évitez de créer (et d’indexer) plusieurs pages ayant des blocs de contenus identiques, c’est-à-dire, du contenu dupliqué interne. Les URLs canoniques (rel=canonical) sont là pour vous aider. 

Pour en savoir plus sur les types de contenus et les types de problèmes qui concernent votre site, rendez-vous dans l’onglet Couverture de votre console Google Search :

Problème d'indexation Google : les avertissements dans la console 

Extrait du centre d’aide de la Google Search Console :


Explorée, actuellement non indexée : la page a été explorée par Google, mais pas indexée. Elle sera peut-être indexée à l’avenir ; il n’est pas nécessaire de renvoyer cette URL pour l’exploration.

L’exploration est le processus de recherche de nouvelles pages ou de pages mises à jour à ajouter à Google (Google a exploré mon site Web). L’un des moteurs d’exploration de Google explore (demande) la page. Les termes « exploration » et « indexation » sont souvent utilisés de manière interchangeable, bien qu’ils désignent des actions différentes (mais étroitement liées).

Détectée, actuellement non indexée : la page a été détectée par Google, mais n’a pas encore été explorée. En règle générale, cela signifie que Google voulait explorer l’URL, mais que l’exploration a été reportée, car votre site risquait d’être surchargé. C’est pourquoi la dernière date d’exploration ne figure pas dans le rapport.

Source :
Les motifs d’état des “Pages exclues” du rapport de couverture de la Google Search Console


Se balader dans cet onglet “Couverture” est l’occasion de parer vos moins bonnes pages de balises robots=noindex et autres rel=canonical.

Par contre, si ce problème de délai d’indexation (ou de non-indexation) touche vos meilleures pages, vos meilleurs articles, et ce, depuis plusieurs jours, il est temps d’analyser et d’optimiser les choses en profondeur !

Les performances de vos pages (la vitesse de chargement)

Comme nous l’avons vu ci-dessus, dans l’étude de cas de notre annonce Google Ads (destination not working), le robot de Google devient de moins en moins friand des sites qui tardent à se charger.

Ça fait quand même +10 ans que Google nous encourage à avoir des sites rapides !

Le temps de chargement d'un site

Les annonces et les rappels de Google se sont succédé pendant toutes ces années, sans qu’une pénalité stricte ne soit constatée concrètement, par exemple, pour les sites se chargeant sous un délai de 3 à 6 secondes.

Sur mobile, 50% du trafic abandonne votre page si celle-ci prend plus de 3 secondes à charger.
— Source : Google

Si vous avez cruellement négligé cet aspect, aujourd’hui, il y a urgence. 

Comment mesurer la vitesse de chargement réelle de son site Internet ?

Le premier réflexe serait de se rendre sur Google Pagespeed Insights (basé sur Lighthouse), puisque c’est l’outil proposé par Google 

Voici un résultat assez classique, pour un site WordPress placé sur un hébergement mutualisé, avec des optimisations de performances de base (un plugin de cache activé, sans plus).

PageSpeed Insights nous annonce un effroyable TTFB (temps de réponse initial du serveur) supérieur à 9 secondes.

Pour votre indexation Google : il faut réduire votre TTFB ! Tests PageSpeed

À la vue de ce score, votre second réflexe est d’aller tirer les oreilles de votre hébergeur Web.

Bien sûr, contrairement à ce qui est sous-entendu sur PageSpeed Insights, le TTFB ne dépend pas que de votre hébergement Web, mais également (en très grande partie), de l’optimisation de votre site (choix du thème, des plugins, du plugin de cache, de minification, de chargement différé/asynchrone…). Mais en réalité et en ce qui concerne ce site, depuis l’Europe et d’après KeyCDN, le TTFB se situe autour des 100 ms :

TTFB avec KeyCDN : un site lent

Et le délai de chargement complet de la page est à peine supérieur à 3 secondes avec un grade A, depuis l’Europe et toujours d’après KeyCDN : 

Temps de chargement : KeyCDN, un site lent

Conclusion, le TTFB présenté par PageSpeed Insights est souvent largement supérieur à celui constaté sur tous les outils d’analyse alternatifs offrant une option de géolocalisation.

La faute aux serveurs brésiliens ? 😀 

Dans les faits, je peux vous dire que la vitesse de chargement de ce site est décente, et celui-ci se positionne extrêmement bien sur Google. Les résultats présentés page PageSpeed Insight sont donc à prendre avec des pincettes et sont plutôt complexes à interpréter. 

Il ne s’agit pas ici d’un article dédié à PageSpeed Insights, car on pourrait écrire des kilomètres de texte à son sujet. Mais gardez à l’esprit que le score indiqué par PageSpeed est un savant mélange entre Vitesse de chargement et Expérience utilisateur.

Nous verrons cela un peu plus loin.

Les critères et score avec PageSpeed Insights

Ci-dessus, la Calculatrice « Lighthouse » disponible via un lien discret sous votre résultat PageSpeed Insights. Elle vous offre un découpage détaillé des points qui impactent votre score.

Les recommandations présentées par PageSpeed Insights seront très précieuses pour les développeurs chevronnés. En revanche, pour l’utilisateur moyen, d’autres outils seront de bien meilleur conseil.

Voici nos 10 +1 outils favoris pour mesurer la vitesse d’un site : 
  1. L’outil de test de vitesse de KeyCDN
  2. L’outil de test du TTFB de KeyCDN
  3. GTmetrix (créer un compte pour choisir la géolocalisation du test)
  4. Pingdom (pratique, mais il n’y a plus de waterfall détaillée, dommage)
  5. WebpageTest (excellent complément détaillé)
  6. Uptrends (onglet Free Tools, outils pratiques et lisibles)
  7. dotcom-tools (beaucoup de régions du monde)
  8. Yellow Lab Tools (utile aux développeurs JS…)
  9. Web.dev, le grand frère de PageSpeed Insights (mêmes données, présentation différente)
  10. Think with Google > Test My Site (audit Google orienté mobile)
  11. Et bien sûr, la Console Google Search (voir plus bas)
Le site EasyHoster.com est-il rapide ?

Les cordonniers sont les plus mal chaussés. Prenons donc comme exemple, le pire élève de la classe 😀

Il faut savoir que le site de vente d’EasyHoster (partie commerciale) est construit avec WordPress, le thème Divi et le constructeur de pages du même nom.

Divi a la réputation d’être l’un des thèmes WordPress les moins rapides du marché (beaucoup de balises, de code et de fichiers par rapport aux thèmes concurrents). L’équipe de développeurs d’ElegantThemes nous assure qu’ils sont en ce moment même, en train de travailler sur plusieurs axes d’amélioration de la vitesse de chargement de Divi.

Le thème WordPress Divi est-il rapide ?

Mais actuellement, c’est vrai, Divi reste encore une petite usine. 

Mise à jour du 23 août 2021 :

Elegant Themes a (déjà) respecté ses promesses en sortant une toute nouvelle version de Divi beaucoup mieux optimisée pour la vitesse de chargement ! Plus d’infos à ce sujet dans notre article complet sur Divi 4.10.

Pourquoi sommes-nous de grands fans de Divi ? 

Divi est un thème très simple (et agréable) à personnaliser, mais ce qu’on préfère, c’est l’ergonomie de son Page Builder visuel. Les pages de vente se composent à coup de cliquer-glisser de blocs de construction, presque comme si l’on construisait un château avec des LEGOs, mais en mieux. Les pages sont tellement simples à construire.

L’essayer c’est l’adopter et malheureusement, on est tombé dedans !

Voici notre dernière page de vente réalisée avec Divi :

Qu’en pensez-vous ? Soyez curieux et jetez un coup d’œil à cette page 😉

Nicolas LaruelleEnvie d’en savoir plus sur les landing pages avec Nicolas Laruelle ?
Souhaitez-vous apprendre à créer des pages de vente efficaces, qui se positionnent sur Google, mais aussi qui vendent ? C’est possible, au travers de 10 heures de formation (de A à Z, de zéro à héro). Découvrez ma toute dernière formation Copywriting & Landing Pages. En tant que lecteur du blog EasyHoster, je vous offre ma meilleure remise, -35% grâce au code promo : EASYHOSTER.
Découvrir la formation »
Comment accélérer WordPress et Divi pour un meilleur score PageSpeed Insights ?

Par défaut, le thème Divi peut vous offrir un score PageSpeed Insights assez médiocre.

Mais des solutions existent !

Grâce à quelques plugins d’optimisations, dont WP Rocket, KeyCDN et surtout, grâce à beaucoup de tests, nous avons pu obtenir un score acceptable sur les différents outils cités (voir captures d’écran au point suivant).

1. Configuration Divi 

Nous laissons activées la minification et concaténation par défaut de Divi.

Configuration de Divi avec WP-Rocket

Nous activons la génération de fichiers CSS statiques. Cela corrigera les ”flash / glitch / shift” de Divi. Si vous ne savez pas de quoi il s’agit, rassurez-vous on en parle plus loin.

Les meilleures configurations avec Divi et WP-Rocket

Dans les versions de Divi 4.10 et supérieures, voici notre configuration.

Optimisations de Divi 4.10 et WP Rocket pour une meilleure indexation Google plus rapide et forcée.

Essentiellement, toutes les optimisations de Divi 4.10 devraient pouvoir être activées, sauf que nous obtenions des erreurs dans la console Javascript avec “Defer jQuery And jQuery Migrate”.

Obtenez 10% de réduction sur Divi en suivant notre lien d’affiliation.

2. Configuration de WP Rocket pour optimiser Divi

Quelle configuration avec Divi, WP-Rocket et PageSpeed Insights

[Cache]

  • Cache mobile : Oui.
  • Cache mobile séparé : Oui (aide le responsive du Divi Builder).
  • Utilisateurs connectés : Non.
  • Délai de nettoyage. : 10 heures (un délai plus long risque de casser des fonctions JS)

[Optimisations JS & CSS]

  • Minification CSS : Oui.
  • Combiner CSS : Non (tous nos serveurs sont HTTP/2).
  • Optimiser le chargement CSS : Non (cela fait flasher le webdesign de Divi, dommage).
  • Removed Unused CSS : Non, car en version bêta.
  • Minification JS : Oui.
  • Combiner JS : Non (HTTP/2).
  • Chargement JS différé : Oui, aucun souci.
  • Reporter le JS : Oui, mais possible altération du tracking du pixel Facebook, à confirmer.
    Fichiers JS exclus : 
    /jquery-?[0-9.](.*)(.min|.slim|.slim.min)?.js

[Média]

  • Lazyload : aucun (bug : images manquantes sur mobile, avec module Divi Image partiellement Désactivé, voir plus loin concernant Smush).
  • Dimensions des images : Oui.
  • Désactiver les embeds : Non.
  • WebP : Non.

[Préchargement]

  • Préchargement : Activé.
  • Sitemap : Oui.
  • Sitemap XML Yoast SEO : Oui, si présent.
  • Préchargement des liens au survol de lien : Oui.
  • Préchargement DNS :
    //cdn.easyhoster.com
    //fonts.gstatic.com
    //fonts.googleapis.com
    (a priori, assez exhaustif pour les ressources arrivant tôt dans la page)
  • Préchargement des polices (icônes Divi) :
    /wp-content/themes/Divi/core/admin/fonts/modules.ttf
    Nous avons notre propre installation de Font Awesome (intégrée en balise <head>).
    Certaines ne sont pas utilisées dans le haut du site (voir console Firefox), mais voici toute la liste au cas où :
    /wp-content/fontawesome/webfonts/fa-light-300.woff2
    /wp-content/fontawesome/webfonts/fa-regular-400.woff2
    /wp-content/fontawesome/webfonts/fa-brands-400.woff2
    /wp-content/fontawesome/webfonts/fa-solid-900.woff2
    /wp-content/fontawesome/webfonts/fa-light-300.ttf
    /wp-content/fontawesome/webfonts/fa-regular-400.ttf
    /wp-content/fontawesome/webfonts/fa-solid-900.ttf
    Police d’icônes à intégrer de façon asynchrone, comme ceci (voir attributs media et onload) :
    <link rel= »stylesheet » media= »print » onload= »this.media=’all' » href= »https://www.example.com/wp-content/fontawesome/css/all.css »>
    Bien vérifier que le préchargement de Font Awesome ne fait pas baisser le score PageSpeed.

[CDN]

  • Activer le Content Delivery Network : 
    cdn.easyhoster.com (pour nous)
  • Exclusion obligatoire pour les fichiers statiques de Divi : 
    /wp-content/et-cache/(.*)/et-core-unified-(.*).min.css
    (sinon, erreur de cross-origin)

Bravo ! En lisant ces quelques lignes, vous venez d’économiser une journée de travail.

Obtenez 10% de réduction sur WP Rocket en suivant notre lien d’affiliation.

3. Configuration KeyCDN :

Configuration à mettre en place pour KeyCDN, WP-Rocket, Divi et PageSpeed

  • Max Expire (min) : 4320.
  • Ignore Query String : Oui.
  • Cache Brotli : Oui (tous nos serveurs EasyHoster sont compatibles Brotli).
  • Expires and Cache-Control (min) : 525000 (1 an, pour faire plaisir à PageSpeed)
  • SSL : Let’s Encrypt.
  • Zone alias : cdn.easyhoster.com
    (c’est notre sous-domaine ; vous, configurez votre CNAME dans vos zones DNS)
  • Force SSL : Oui, pourquoi pas.

Obtenez 10$ de crédits KeyCDN (sans engagement) en suivant notre lien d’affiliation.

4. Configuration du lazyload des images via Smush

En complément, nous utilisons le plugin Smush, car actuellement, il fonctionne mieux que celui de WP Rocket avec Divi. Selon nos derniers tests, le lazyload de WP Rocket faisait planter certaines images sur mobile lorsque le masquage de modules responsives était activé. Alors que le plugin gratuit de Smush fonctionne à merveille avec Divi. 

Le lazyload avec Smush, PageSpeed Insights et Divi

Voici notre configuration Smush pour le lazyload :

  • Media Types : tout sauf SVG.
  • Output Locations : tout sauf les Widgets.
  • Display & Animation : None.
  • Class & IDs exclusion : #logo (pour ne pas faire flasher notre logo)
5. Configuration de l’hébergement cPanel

Gros bonus, la configuration sous le capot et côté serveur chez EasyHoster :

Tableau de bord cPanel chez EasyHoster

  • Plugin Asset CleanUp pour désactiver sélectivement les plugins inutiles sur les meilleures pages.
  • Disable WP Cron : true + CRONs cPanel via WP Toolkit (voir compte cPanel EasyHoster).
  • Heartbeat réduit par WP Rocket.
  • Révisions de WordPress,
    WP_POST_REVISIONS : 6,
    AUTOSAVE_INTERVAL : 300.
  • xmlrpc.php : deny via .htaccess.
  • wp-login.php : page déplacée grâce au plugin Change wp-admin login.
  • Backups optimisés CodeGuard (au lieu d’un plugin gourmand comme Updraft).
  • Anti-DDoS et brute force en béton :
    cPHulk, CSF, Imunify360 + grosse bande passante.
  • HTTP/2.
  • PHP : 7.4 (bientôt PHP 8.0)
  • interface PHP : mod_lsapi.
  • Extensions PHP : OPcahe, Memcached.
  • Serveur compatible Brotli.
  • Gzip configuré au max via cPanel. 
  • MySQL : MariaDB 10.3 avec tables optimisées.
  • RAM PHP : 512M.
  • RAM WordPress : 
    WP_MEMORY_LIMIT : 128M,
    WP_MAX_MEMORY_LIMIT : 368M

Plus d’infos : Comment optimiser WordPress côté serveur ?

Et voilà ! Il faut bien tout cela pour optimiser Divi 😀 

Bravo ! Vous venez d’économiser des mois de tests d’optimisation de WordPress et de votre hébergement cPanel 😀

Un mot sur le support technique d’EasyHoster : 
Inutile de préciser que tous les clients des hébergements EasyHoster sont chaleureusement invités à nous contacter par ticket, pour toute question relative à ce long article sur l’indexation Google.
EasyHoster est bien plus qu’un hébergeur 😉
Voici la preuve que le site EasyHoster.com est rapide !

Vous les attendiez !

Voici les captures d’écran des résultats obtenus par cette configuration de :
Divi + WP Rocket + KeyCDN + Smush Lazyload.

GTmetrix :

Tout est au vert. Chargement complet en moins d’1 seconde.

Les tests GTmetrix

KeyCDN Tools :

Grade A. Temps de chargement inférieur à 3 secondes.

Indexation Google : les outils (tools) de KeyCDN

Pingdom Speed Test :

Grade A. Chargement partiel (presque complet) en une demi-seconde.

Les outils (tools) de Pingdom

Tout le monde semble content…

Sauf PageSpeed Insights :

Lui, il hésite encore entre rejoindre la fête, ou faire la tête assis dans son coin…

Indexation Google : tester votre site avec PageSpeed Insights

Comment lire les données de PageSpeed Insights ? 

Très important, sur la capture d’écran ci-dessus, vous pouvez observer 2 grandes catégories : 

  1. Données de terrain (field data)
  2. Données de laboratoire (lab data)

Les données de terrain sont collectées depuis des visites concrètes et réelles effectuées sur la durée, sur un laps de temps de 28 jours. Cette première catégorie n’est pas fiable pour évaluer les travaux d’optimisation que vous êtes en train d’effectuer sur votre site. 

Les données de laboratoire sont celles qui viennent d’être récoltées en temps réel, juste après le clic du bouton « Analyser » de PageSpeed Insights.

Le TTFB sur Google : PageSpeed Insights

Pour mieux comprendre les résultats PageSpeed Insights, visitez la calculatrice et les suggestions d’optimisation :
FCP, LCP, TBT et CLS.

Dans l’idéal, les 4 ou 6 catégories de tests devraient être passées au vert (ou au moins, à l’orange). Juste en dessous, vous retrouvez respectivement 4 catégories de suggestions d’optimisation très un peu techniques : FCP, LCP, TBT, CLS.

Conclusion sur PageSpeed Insights.

Clairement, on n’atteindra pas le score de 100% avec WordPress + Divi… et ben tant pis, parce qu’on les aime ces technologies !

Encore une fois, si vous souhaitez vous arracher les cheveux pour améliorer votre score PageSpeed Insights, allez-y ! C’est un outil qui vous donnera de bonnes recommandations (très techniques). Mais s’il vous plaît, confrontez aussi votre site à d’autres outils d’analyses qui se montreront, dans la plupart des cas, beaucoup plus lisibles et simples à comprendre. A priori, si tous les autres outils vous présentent de bons résultats, ça sera OK pour votre référencement Google.

Comment détecter un site trop lent grâce à la Console Google Search ?

Oui, il est possible d’obtenir des informations sur la vitesse de votre site, à la source, directement depuis votre console Google Search. Pour cela, rendez-vous sous l’onglet Signaux Web essentiels, observez les graphiques et cliquez sur Ouvrir le rapport.

Surveiller la vitesse de chargement de votre site

Comme vous pouvez le voir, ces captures concernent un site manifestement mal optimisé, puisque Google nous annonce au moins 175 pages dont le LCP, c’est-à-dire, le temps de chargement du contenu (hors défilement) est supérieur à 4 secondes

Pas de panique, cela ne signifie pas que vous êtes blacklisté de Google.

Pour info, le site dont il est question sur cette capture d’écran génère des centaines de visiteurs organiques chaque jour et ses articles se positionnent plutôt bien. Bien sûr, corriger le problème signalé par la console de Google permettra d’obtenir d’encore meilleurs résultats, ne fût-ce qu’en améliorant l’expérience utilisateur et donc, le taux d’engagement des visiteurs avec ce site.

Site lent : surveiller l'indexation Google de votre site

Si cette interface vous était inconnue auparavant, je vous recommande d’y jeter un oeil et de vérifier tous vos sites. Vous passez peut-être à côté de quelques réglages qui pourraient accroitre les résultats de vos meilleures pages Web.

Comme vous vous en doutez, ces données sont mesurées par le même algorithme que PageSpeed Insights. Donc, une fois n’est pas coutume, rendez-vous directement sur cet outil pour tenter de comprendre ce qu’il se passe.

Mais ne négligez pas KeyCDN, GTmetrix, Uptrends, etc !

Le CLS : la vitesse, c’est bien sauf si cela pénalise l’expérience utilisateur !

Est-ce que vous vous en souvenez ? Un peu plus haut, je vous indiquais que PageSpeed Insights ne s’intéressait pas qu’à la vitesse de chargement des pages, mais aussi à l’ergonomie et l’expérience qu’elle offre à l’utilisateur.

En vous rendant sous l’onglet Signaux Web essentiels de la console Google Search, vous trouverez peut-être d’étranges erreurs indiquant la présence « d’URLs lentes »…

Les URLs lentes à améliorer

Des erreurs pas comme les autres…

L'indexation Google et le CLS

La console nous parle ici d’un problème de CLS supérieur à 0,25 secondes.

Qu’est-ce que le CLS ou Cumulative Layout Shift ?

En naviguant sur Internet, vous avez peut-être déjà remarqué que certains sites se chargent progressivement

  • d’abord le texte brut
  • ensuite les couleurs
  • puis le reste du webdesign
  • les polices d’écriture
  • et les images pour terminer !
CLS (cumulative layout shifts) sur WordPress : glitch, flash dans votre webdesign

CLS d’une durée tolérable.

Ce phénomène s’appelle le Cumulative Layout Shift (CLS). Le plus souvent, il n’a lieu que pendant votre première visite, le temps de mettre en cache les premiers fichiers essentiels du site, dans la mémoire de votre navigateur Internet.

Visuellement, c’est un peu comme si le site se construisait rapidement devant vous. Mais sur certains sites, ce délai de chargement progressif peut parfois durer pendant une longue seconde, voir un peu plus !

Dans le jargon, on dit que le webdesign « flash » au chargement… il y a un glitch.

Pourquoi est-ce qu’un webdesign a du Cumulative Layout Shift ? 

Qu’est-ce qui cause le CLS ?

Dans la plupart des cas, cela arrive lorsqu’on choisit de charger certains fichiers CSS et JavaScript de manière différée ou asynchrone. C’est le genre d’option qui est mise en avant par la plupart des plugins destinés à améliorer la performance de WordPress.

Chargement différé en asynchrone (CLS), régler votre problème avec un plugin de cache WordPress

Capture issue de WP Rocket.

Notez que ces options de chargement différé peuvent parfois détériorer votre webdesign et/ou certaines fonctionnalités de votre site. Il convient donc de les activer une à une et d’effectuer à chaque fois un grand nombre de tests sur vos pages, votre canal d’achat et vos formulaires (contact, inscription). Réalisez des tests à chaque modification d’un paramètre de ce type. Optimiser finement les performances d’un site WordPress peut dans certains cas prendre plusieurs jours de travail.

Bien sûr, le chargement différé du CSS et/ou du JS est recommandé (et même essentiel) dans de nombreux cas.

C’est d’ailleurs une optimisation conseillée par Google PageSpeed Insights :

  • Éliminez les ressources (feuilles CSS/JS) qui bloquent le rendu
  • Différez le chargement des images (masquées hors écran)
  • Réduisez et différez le chargement des ressources Javascript

Google tolère un maximum de 0,25 seconde de CLS !

Les pages lentes et CLS

En effet, même si le shift dure moins d’1 seconde, cela peut poser des problèmes d’ergonomie.

Imaginez qu’une page se charge avec 2 boutons :

  • « Oui, passer commander »
  • « Non, revenir à la boutique »

Le visiteur change d’avis concernant sa commande. Il souhaite revenir en arrière, mais juste avant le clic sur « Non, revenir à la boutique », une bannière publicitaire apparait en haut de page. Ce shift a pour effet de faire descendre les 2 boutons et sans le vouloir, le visiteur clique sur le mauvais bouton, « Oui, passer commander » et sa carte de paiement est débitée, avec tous les désagréments que cela peut entraîner.

Courte vidéo pour comprendre le CLS en 12 secondes (animation) :

Dans ce cas de figure, on peut comprendre que Google nous encourage à éviter le shift autant que possible.

Nous sommes de retour dans notre console Google Search.

En cliquant sur la liste estampillée « Exemples », nous trouvons une liste « d’URLs similaires » étant toutes victimes du même problème de CLS trop élevé. 

Le CLS : liste des URLs

Pour corriger cela, soyez curieux et n’hésitez pas à consulter PageSpeed Insights en filtrant la catégorie CLS.

PageSpeed s’efforcera de mettre en avant la zone de webdesign ayant le plus haut niveau de contribution négative à votre CLS et ce, capture d’écran à l’appui ! 

Indexation Google : corriger le CLS sur WordPress

Concentrez-vous en priorité sur les zones de webdesign ayant la plus haute contribution au CLS.

Bien sûr, rien ne vaut les tests manuels : 

  • Faites des réglages sur votre site (plugin de cache, plugins liés au problème de CLS signalé)
  • Vider le cache de votre site, CMS, CDN et celui de votre navigateur (maintenir la touche SHIFT + clic sur le bouton Refresh du navigateur)

Ensuite, constatez ce qui shift, ou pas et affinez progressivement les réglages.

C’est un travail de fourmi.

Lorsque vous êtes satisfait de votre nouveau CLS signalé par PageSpeed Insights, revenez sur votre Google Search Console et signalez à Google que vous avez effectué la correction demandée en Validant la correction :

Faire valider la correction du CLS sur votre site

Ensuite, Google surveillera votre site pendant 28 jours.

Oui… le référencement Google demande beaucoup de patience 🙂

Indexation sur Google : l'état de la validation du CLS

La moralité dans tout cela, c’est qu’il faut avoir une vision globale, pour l’optimisation de l’expérience utilisateur sur son site Internet. 

Vouloir accélérer le délai de chargement de son site, c’est bien et cela peut se faire, entre autres, en chargeant les fichiers CSS, JS et Images de façon asynchrone ou différée. Mais cela peut aussi poser des problèmes, avec par exemple, un webdesign qui glitch.

Heureusement, il y a souvent des solutions, notamment, pour le thème Divi. Rappelons qu’il s’agit du thème WordPress le plus populaire du marché (et aussi, celui que nous utilisons sur ce site). S’il était impossible de faire indexer ses pages, les utilisateurs auraient vite fait de migrer vers Elementor.

Il convient de trouver un compromis entre rapidité de chargement, esthétique (image de marque), expérience utilisateurs, et pour cela, Divi fait très bien l’affaire.

Comment surveiller l’exploration de Google sur mon site, sans logs serveur incompréhensibles ?

Puisque vous attendez patiemment que Google indexe vos pages, vous voudrez probablement découvrir à quelle fréquence il visite votre site ?

Cela se passe dans la Google Search Console, sous un onglet que vous n’avez peut-être pas pensé à parcourir. 

L’onglet : Paramètres !

Vous y trouverez une ligne « Statistiques sur l’exploration » donnant accès à un rapport du nombre de crawls effectués sur le site durant les 3 derniers mois.

Rapport dans votre GSC : statistiques et exploration

Ouvrir ce rapport vous permet d’évaluer rapidement si la fréquence de crawl a diminuée ou augmentée récemment. Vous constaterez que plus vous ajoutez régulièrement de contenus utiles sur votre site, plus Google se manifestera sur celui-ci. 

Problème d'indexation sur Google à cause d'un problème d'hébergement Web

Une autre donnée très précieuse est le temps de réponse moyen de la page.

Un monitoring gratuit de votre TTFB dans votre Google Search Console

Sur le graphique, l’avant-dernier point le plus bas correspond à 250 ms, un score qui devrait être un peu amélioré.

Alors que beaucoup d’entreprises facturent ce type d’outil, Google nous offre ici un service de monitoring du temps de réponse du serveur.

Qu’est-ce que le Temps de réponse moyen de la page ? 

D’après Google, « c’est le temps de réponse pour une exploration visant à en afficher le contenu. Cette valeur ne tient pas compte de l’extraction des ressources (scripts, images et autres contenus liés ou intégrés) ni du temps d’affichage de la page ».

Cette définition ressemble bien à celle du TTFB !

Il n’est pas possible de savoir avec précision depuis quel pays cette analyse est effectuée. Par contre, ce graphique peut nous permettre d’évaluer l’impact de nos optimisations de performance récentes, ou même si nous avons bien fait de changer d’hébergeur Web.

Comment détecter les problèmes d’indexation liés à mon hébergement Web ?

Juste en dessous, une ligne devrait attirer votre attention.

L’État de l’hôte !

Problème à cause de votre hébergeur web

On peut imaginer facilement que « hôte », c’est la traduction maladroite de « host », pour laquelle Molière aurait dit « Hébergement » ou « Hébergeur ».

Suivre ce lien vous donnera quelques informations complémentaires en 3 catégories : 

Indexation Google et problème d'indisponibilité de votre hébergement web

  1. Est-ce qu’on a pu accéder au fichier robots.txt ?
  2. Est-ce qu’on a pu faire un lien entre votre nom de domaine et votre serveur d’hébergement (DNS) ?
  3. Est-ce que le serveur était souvent en ligne et non surchargé (connectivité du serveur) ?

Intéressons-nous à cette 3e ligne qui contient justement 7,5% d’erreur en date du 7 juin.

Outre son service de monitoring de « Temps de réponse » vu précédemment, la console Google Search nous offre ici un véritable service de monitoring de « Disponibilité » (« uptime » en anglais).

Si vous avez fait le choix d’un hébergeur bon marché, cela vous permettra de vérifier si oui ou non, votre site et disponible 99% de temps. De même, cet indicateur vous permet de confirmer que votre hébergeur ne bloque pas (même aléatoirement) le robot d’exploration de Google. Ce qui serait bien sûr, très préjudiciable. 

Chez EasyHoster, tous nos serveurs sont monitorés 7j/7, 24h/24, par une société tierce et objective appelée UptimeRobot et nous sommes avertis du moindre incident sur nos serveurs, de jour comme de nuit. En tant que client d’un hébergeur premium, vous ne devriez pas avoir à vous inquiéter du monitoring de vos sites Internet.

Comment forcer rapidement l’indexation des pages d’un site sur Google ?

1. L’outil d’inspection de l’URL pour demander une indexation

Depuis 2011, grâce à l’outil « Explorer comme Google », il est très simple, rapide et efficace de demande à Google d’indexer, ou de mettre à jour, n’importe quel contenu validé dans les Google Webmaster Tools.

Reindexer votre contenu sur Google et mettre à jour vos pages pour le SEO

C’est une vieille capture et bien sûr, l’outil « Fetch as Googlebot » a bien évolué avec le temps.

Comment réindexer vos contenus sur Google et mise à jour de vos pages : SEO

Aujourd’hui, les délais et le succès d’indexation d’une page est devenu aléatoire., mais l’outil reste néanmoins toujours (bien) présent.

Quoique… récemment, Google nous a fait une frayeur…

Vérifier votre classification dans la Google Search Console

L’outil a été en panne du 14 octobre 2020 au 20 décembre 2020.

Comment forcer l'indexation Google d'un contenu ?

D’après Google, cette maintenance de l’outil était liée à des changements techniques… relatifs à l’indexation de contenu ? Ces mêmes changements que nous sommes de plus en plus nombreux à constater ? Hmm ?

John Mueller s'exprime le sujet Juste pour le contexte, cela n’affecte pas l’exploration et l’indexation normales. En général, les sites n’ont jamais besoin d’utiliser cette fonctionnalité d’indexation. D’ailleurs, la plupart d’entre eux ne l’ont jamais utilisée du tout
John Mueller, le 15 octobre 2020 sur Twitter.

À l’époque sur Twitter, beaucoup de questions et de plaintes ont été transmises aux employés de Google.

Tweet sur l'indexation Google de Vincent Courson

Vincent Courson, Google Ireland

Certes, les bots de Google sont d’ores et déjà très performants et ont tendance à rapidement indexer les nouveaux contenus publiés sur Internet. Cependant, il est compréhensible, de la part d’un éditeur de site qui a beaucoup travaillé sur son contenu pour se conformer aux exigences de Google, de souhaiter « signaler » aux robots qu’il y a eu une mise à jour. Ne fut-ce que pour le moral 😀 

En tout cas, cela serait bête de la part de Google de se priver d’une main-d’œuvre gratuite toute disposée à lui signaler patiemment, manuellement, quand quelque chose a changé sur le Web. D’autant qu’aujourd’hui, l’outil d’indexation permet uniquement de demander le rafraîchissement d’une seule page à la fois. Alors que la première version de l’outil permettait de soumettre chaque mois, un quota de demande de réindexation d’une page et de toutes les pages liées à celle-ci. Il était donc possible d’exiger de Google de faire réindexer un site entier, en lui soumettant l’URL d’un sitemap HTML.

D’ailleurs, les sitemaps, parlons-en !

2. Les sitemaps ou les plans de site XML

Google met régulièrement en avant l’intérêt (pour vous) de soumettre un ou plusieurs sitemaps XML, via sa console.

Ce fichier tout beau, tout propre et bien structuré doit probablement faire économiser beaucoup de ressources aux robots d’exploration, qui, à l’origine, disposaient uniquement de pages HTML très mal structurées comme seul moyen pour découvrir de nouveaux contenus.

Google est friand de sitemaps XML et la rumeur dit que ceux-ci permettraient au moteur de recherche de plus rapidement identifier tous vos nouveaux contenus, ainsi que les mises à jour majeures que vous pourriez effectuer sur votre site, comme l’installation d’un CDN par exemple

Si Google le dit, c’est que c’est vrai 😂

Dans tous les cas, comme toutes les autres astuces que nous allons vous présenter ci-dessous… cela ne mange pas de pain ; on ne sait jamais ce qui peut arriver ; sur un malentendu ça peut fonctionner.

Vérifiez donc que vous avez bien soumis les sitemaps correspondant à vos différents types de contenu.

Vous devez soumettre votre sitemap sur Google

Sous WordPress, créer vos sitemaps peut être fait grâce à un plugin comme Yoast SEO.

Dans tous les cas, même si l’indexation de vos contenus n’est pas accélérée ni garantie, cette action aura le mérite de vous donner plus d’informations sur ce que Google pense de votre site.

3. Ping-o-Matic

Disclaimer alert : À partir de maintenant, les conseils donnés vont progressivement rentrer dans des techniques considérées par certains professionnels du référencement, comme « ésotériques » ou « fantasmées ». Mais puisqu’avec l’algorithme secret de Google, on n’est jamais sûr de rien, autant mettre toutes ses chances de son côté ?

Pingomatic.com, c’est ça : 

Utiliser Pingomatic pour indexer vos contenus

Honnêtement, on n’a pas pris le temps de faire un test SEO très poussé pour voir si les pings étaient toujours explorés par Google. Honnêtement, on ne s’est pas renseigné plus que cela et il y a des chances pour que le site Pingomatic.com, en lui-même, ne soit plus réellement maintenu par la WordPress Foundation ou en tout cas, pas très régulièrement si on se fie à l’aspect de ce service. 

Tout ce qu’on peut vous dire, c’est que :

A. En 2010, lorsque Google a lancé son nouvel algorithme d’indexation nommé Google Caffeine, il vous suffisait de pinger un flux RSS sur Pingomatic pour voir votre contenu instantanément indexé dans Google. C’était impressionnant pour l’époque ! 

B. Par défaut, dans tous les sites WordPress > Tableau de bord > Réglages > Écriture, on retrouve toujours l’URL de ping RPC de Pingomatic : http://rpc.pingomatic.com. Pourquoi la conserver sur des millions de sites si le service est devenu totalement obsolète ?

Réglages WordPress : service de mise à jour avec Pingomatic

C. Il est toujours fait mention de Feed Burner dans les services à « pinger » de Pingomatic. Feed Burner reste un service de Google, même si ce service non plus ne semble plus trop bien maintenu. Quoiqu’il est toujours possible de créer un nouveau Feed. D’ailleurs, voici celui d’EasyHoster créé en 2 minutes ! 

Procéder à votre inscription sur Feedburner

Feed Burner annonce une maintenance ? Certainement rien d’important. Mais l’inscription d’un site sur Feed Burner reste toujours possible en 2021 via https://feedburner.google.com.

 

Ensuite, faites un ping de votre contenu sur Feedburner

Après création d’un flux FeedBurner lié à votre blog, il vous est possible de pinger FeedBurner à cette adresse https://feedburner.google.com/fb/a/ping

D. Réaliser manuellement un ping après la publication d’un gros article comme celui-ci prend en tout et pour tout : 5 secondes !

Alors oui, tout cela peut paraitre archaïque. Oui, cette action est peut-être strictement inutile aujourd’hui. Mais nous pouvons penser, en regard des quelques informations données, que réaliser un ping permet peut-être toujours (éventuellement), d’alerter Google sur la publication de vos nouveaux articles de blog.

Mise à jour :

Après vérification rapide, je vous confirme (et je vous garantis) que les pings envoyés automatiquement par WordPress, les pings issus de Pingomatic.com et les pings de FeedBurner sont toujours bel et bien synchronisés !

Voyez par vous-même dans ces pings manuels réalisés immédiatement après un clic sur le bouton « Publier » pour cet article :

Résultat sur Pingomatic après ping sur Feedburner Résultat d'un ping sur Feedburner après un ping sur Pingomatic

Je vote pour dire que ces pings sont toujours utilisés (dans une certaine mesure) par Google Search. Après tout, Google arrive à découvrir des blogs WordPress fraîchement dézippés sur leur hébergement Web. Cela ne peut venir que des pings, à moins qu’un lien soit créé vers votre site depuis un annuaire de noms de domaine.

4. Tweeter sur Twitter

Le nom de domaine twitter.com, c’est près de 2 milliards de contenus indexés si on se base sur les résultats de la requête « site:twitter.com » de Google. 

C’est chaque minute, des milliers de nouveaux tweets fraîchement tweetés, fraîchement indexés. 

Indexation rapide des contenus postés sur Twitter

Chercher un hashtag sur Google permet de se rendre compte que l’indexation des tweets est très rapide. Quid des liens partagés ?

Un article devient viral sur Twitter, est-ce que cela impact le SEO ?

« Pur fantasme » diront certains. « Les signaux issus des réseaux sociaux ne valent rien, seul le netlinking a un impact sur le positionnement de sites ».

À vous de voir…

Pour ma part, j’ai toujours pensé que Google serait fou de se priver des informations publiques issues des réseaux sociaux, par exemple, pour l’aider à trouver et donner plus de poids aux contenus populaires. 

Faites-vous votre propre avis, mais dans le doute et si l’indexation d’une page cruciale peine à se faire… personnellement, je prends 2 minutes pour l’envoyer sur Twitter. 

Et si tout cela ne suffisait pas ?

Malgré toutes ces manoeuvres et les outils mis à notre disposition par Google (et c’est tout le sujet de cet article), de nombreux utilisateurs expérimentent de plus en plus de délais d’attente pour l’indexation de nouvelles pages, en particulier sur leurs petits sites secondaires.

Alors, au final, comment s’adapter pour mettre toutes les chances de notre côté pour plaire à un Google plus strict que jamais ?

Comment résoudre les problèmes et réduire le délai d’indexation sur Google ? 

Les algorithmes de Google sont encore plus secrets que la recette du Coca-Cola, faut-il le rappeler ?

Avec Google, on n’est jamais sûr de rien à 100% !

Faire du reverse engineering est d’autant plus complexe que les algorithmes changent en permanence. De plus, avec le référencement Google, la réponse est souvent « Ça dépend »

  • Faut-il beaucoup plus de contenus sur ma page ? Ça dépend…
  • Faire plus de netlinking aura-t-il un impact sur le positionnement de mon site ? Ça dépend…
  • Gagner 500 millisecondes de temps de chargement va-t-il améliorer mon positionnement ? Ça dépend…
Disclaimer bis : Encore une fois, ces suggestions sont à prendre ou à laisser. Nous aurions pu prendre le temps de faire de longs tests SEO, mais cet article aurait pris 2 mois à être rédigé et serait 4 fois plus long. Nous préférons nous concentrer sur la création de contenus utiles à notre communauté de clients. À vous de faire vos tests.

5 idées de solutions [temporaires] pour forcer l’indexation Google

  1. Lier votre nouveau contenu depuis toutes les pages de votre site, dans le pied de page par exemple.
    Ce lien bien placé encouragera le bot de Google à découvrir votre contenu dès qu’il repassera sur votre site.
  2. Faire valider une annonce Google Ads et générer quelques clics.
    Cela pourrait inciter le bot organique de Google à découvrir aussi votre nouveau contenu plus rapidement. Le trafic issu de Google Ads sera heureux de pouvoir retrouver facilement une URLs visitée précédemment, grâce à une recherche organique sur Google Search.
  3. Partager abondamment votre contenu sur les réseaux sociaux.
    Il n’y a pas que Twitter, il y a aussi LinkedIn, Facebook, YouTube, Instagram (le lien en bio), Pinterest, Medium, Tumblr, Blogger, Google Plus (oops, non désolé)…
  4. Obtenir un lien sur un site à fort trafic générant beaucoup de contenu quotidien.
    Peut-être que vous travaillez dans une thématique où vous pourriez placer un lien en signature sur un forum de discussion. Vous pourriez créer un lien vers votre nouveau contenu, depuis votre signature et poster quelques nouveaux messages pour stimuler un peu Google. 
    Même principe pour le blogging : est-ce que vous suivez un blogueur prolifique qui vient de publier un article, très récemment où vous pourriez vous faire valider un joli commentaire le jour même ? Les liens en signature sont presque toujours nofollow, mais notre objectif ici est d’encourager Google à explorer notre page. Pas d’augmenter notre positionnement.
  5. Attirer du trafic direct sur votre site.
    Entre sa messagerie Gmail ; son navigateur Google Chrome ; votre tag Google Analytics ; et la microcaméra qui est fixée derrière votre épaule droite 😀 S’il le souhaite, Google ne manque pas de moyens pour traquer le trafic naturel circulant sur Internet. Vous avez créé un contenu de qualité ? Partagez-le à votre communauté au travers d’une newsletter. Google est (presque) un service public. Si ces précédents lecteurs veulent retrouver votre article sur leur ordinateur, après l’avoir survolé sur Smartphone, Google se doit de leur offrir une réponse, au risque de les décevoir. N’est-ce pas ? 

Donner un coup de boost à un nouveau contenu, pour le rendre populaire « hors Google », peut-être un bon moyen d’attirer l’attention du moteur de recherche sur ce nouveau contenu.

Rappel des techniques vues précédemment : 

  1. L’outil d’inspection et d’indexation d’URLs de la Google Search Console
  2. L’enregistrement des Sitemaps XML dans la Google Search Console
  3. Les Pings de Feed Burner et Ping-o-matic
  4. Le partage de lien sur Twitter

On continue notre liste d’astuces !

10 idées de solutions [long terme] pour optimiser l’indexation Google

On peut forcer mille fois mille pages… non. On peut forcer une fois mille pages, mais on ne peut pas forcer mille fois mille pages. Non. On peut forcer une fois mille pages, mais on ne peut pas forcer mille fois une page. Non…

On est d’accord 😀 Si vous souhaitez faire indexer une boutique e-commerce avec 300 références produits, vous n’allez pas pouvoir créer 300 petites annonces Google Ads pour hypothétiquement faire plaisir à Google, sans certitude de résultats. Vous allez forcément devoir miser sur autre chose.

Donc, quelles sont les bonnes pratiques supplémentaires à mettre en place sur le long terme, pour bénéficier d’une bonne vitesse d’indexation ?

  1. Compléter toutes les pages existantes qui sont actuellement pauvres ou obsolètes.
    Ne faites pas perdre son temps à Google. Pour chaque lien, chaque adresse URL, Google doit visiter la page, analyser son contenu, positionner le lien sur un nombre infini d’expressions clés et en plus de cela, conserver un historique des modifications de votre contenu. Ça prend du temps et ça consomme ! Vraiment… agrémentez chacune de vos pages pour qu’elles aient un intérêt à être présentées aux utilisateurs. Et ne vous contentez pas d’y ajouter 200 mots de texte inutile à l’arrache pour gruger l’algorithme, hein 😉 
  2. Supprimer définitivement les contenus peu utiles de son site Internet.
    Si vous ne pouvez pas corriger votre contenu, parfois, il faut savoir se séparer d’un article, par exemple, s’il est obsolète et qu’il génère 0 visite par mois. Faites une redirection vers un contenu similaire et d’actualité.
  3. Désactiver l’exploration et l’indexation des pages de faible qualité.
    Si vous ne pouvez ni refondre les contenus de faible qualité ni les supprimer, utilisez le robots.txt, la balise meta robots et la balise canonical pour empêcher leur indexation. Cela peut être particulièrement utile pour les contenus redondants, les pages en double, etc. Par exemple, le contenu dupliqué généré par les filtres de recherche ou les filtres de produits e-commerce (Taille, Couleur, etc). Ne fatiguez pas Google inutilement. Vos faibles contenus « voisins » peuvent impacter négativement vos précieuses meilleures pages.

  1. Créer régulièrement de nouveaux contenus à haute valeur ajoutée.
    Soyez constant dans vos publications. Un minimum de 1 article ou 1 page de vente par semaine, cela serait un rythme idéal pour un entrepreneur solo. Est-ce jouable pour vous ?
  2. Optimiser le chargement de votre site à la perfection.
    Pensez aussi à améliorer l’expérience utilisateur de votre site en choisissant un hébergeur Web premium. Changez de thème WordPress si nécessaire (voir le guide d’optimisation de Divi ci-dessus) ; réduisez le nombre d’extensions installées sur votre site WordPress ; configurez finement un ou plusieurs plugins de performances pour WordPress.
  3. Améliorer l’autorité de votre site en cumulant les facteurs externes (netlinking de très haute qualité non suroptimisé ; présence sur les réseaux sociaux ; trafic direct ; etc).
  4. Surveiller l’ergonomie mobile de chacune de vos pages et sections de votre site, notamment via la Google Search Console (onglet : Expérience sur la page) et via la liste d’outils vue ci-dessus.
  5. Lier vos pages intelligemment. Améliorez votre maillage interne, y compris en mettant en place une structure en silo et en rendant chaque lien de votre site, bien catégorisé d’un point de vue sémantique, mais également accessible en 2 clics depuis votre page d’accueil afin que Google puisse consommer facilement ces petits sitemaps HTML bien optimisés. 
  6. Penser à l’utilisateur. Google envoie du monde dans votre boutique et il attend que ces gens soient bien traités. C’est sa réputation qui est en jeu. Gardez cela à l’esprit en permanence ! Et vous pourrez vous considérer comme bon en référencement pendant les 10 prochaines années.

Rien de tout cela ne fonctionne du premier coup ?

C’est très probable…

Lâchez prise. Si votre contenu est vraiment génial, vous devrez peut-être patienter 4 ou 5 jours (au pire des cas), avant qu’il ne soit positionné sur Google ? Il n’y a pas mort d’homme et au moins, maintenant, vous connaissez le « Predictive Crawling ».

Cet article vient de passer les 10.000 mots…

J’espère donc vous avoir partagé suffisamment d’idées pour vous aider à finalement les faire indexer ces fichus pages bloquées par Google ! 

Lorsqu’on voit le coût exorbitant du trafic payant sur Google Ads, le trafic issu du référencement naturel est une panacée pour le développement de votre activité en ligne. La seule règle pour en profiter, c’est d’apporter du contenu de valeur au moteur de recherche. 

Comme l’atteste la longueur de cet article… chez EasyHoster, on applique nos propres conseils !

Grâce à des techniques SEO pérennes et pleines de bon sens, vous ne devriez jamais craindre les changements d’algorithme. En vous assurant de respecter les intérêts du moteur de recherche de Google, il n’y a aucune raison pour que vous perdiez de la visibilité. En tout cas, c’est valable si vous continuez d’entretenir vos contenus régulièrement. Une petite relecture de vos meilleurs contenus tous les 6-18 mois est indispensable.

Maintenant, c’est à vous de jouer !

Nicolas LaruelleCet article a été rédigé par Nicolas Laruelle.
Pour aller plus loin avec moi au sujet du référencement Google, je vous propose de télécharger ma formation SEO de 4 jours (6 heures de vidéo + bonus, PDF, etc). En tant que lecteur du blog EasyHoster, je vous offre une remise de -35% grâce au code promo EASYHOSTER.
Découvrir la formation »

 

Un dernier mot sur l’indexation et plus globalement, sur le référencement Google…

Combien de temps pour référencer un site sur Google et comment améliorer son indexation sur le long terme ?

La vitesse d’indexation d’un contenu peut varier de plusieurs heures à plusieurs semaines. Dans le dernier cas de figure, il convient d’optimiser son site, ses contenus, mais aussi ses habitudes pour plaire à la nouvelle politique d’indexation de Google…

  1. convivialité
  2. qualité
  3. régularité

Tout ce qui arrive aujourd’hui n’a rien d’étonnant. Google nous avait prévenus il y a longtemps.

Nicolas Laruelle avec Matt Cutts et John Mueller

Nicolas Laruelle avec John Mueller et Matt Cutts, chez Google à San Francisco en 2013.

Cela fait 10 ans que Google nous le dit…

Privilégiez la qualité à la quantité !

Ne réfléchissez pas trop à combien de mots vous pouvez écrire sur tel ou tel sujet et combien de sujets juteux vous pouvez aborder pour attirer du trafic. Assurez-vous simplement que le contenu que vous créez est utile, passionnant et vraiment de la plus haute qualité possible.

Faites comme moi aujourd’hui !

Agissez comme si vous n’écriviez pas pour un moteur de recherche, mais pour de futurs abonnés, partenaires ou clients.

C’est vrai après tout…

Toutes les semaines, vous écrivez déjà des messages d’excellente qualité, par e-mail ou sur Messenger. 

Il vous arrive de réaliser de longs textes explicatifs pour aider des ami ou de la famille et vous savez que ce type de contenu est de haute valeur ajoutée, parce qu’il va apporter quelque chose au lecteur. Il va solutionner un problème ou au moins répondre à une question.

Si vous réalisez massivement du contenu sur Internet uniquement dans le but de générer du trafic et des ventes artificielles, vous savez probablement au fond de vous que votre contenu n’apporte pas une grande valeur au monde qui est sur Google et qui recherche du bon contenu.

Ce qui sera génial pour vous en adoptant cette nouvelle façon de penser votre référencement, c’est que vous pourrez vous laisser aller à exprimer votre créativité.

Vous n’avez pas envie de créer de contenu aujourd’hui ? Faites autre chose…

En temps voulu, vous pourrez vous exprimer sur les sujets prioritaires qui vous intéressent et non ceux qui génèrent le plus de clics. Vous ne serez plus contraint à publier 150 articles par an pour maintenir un trafic Google suffisant…

Et au bout du chemin, ce qu’il y aura derrière vous, ce sera un véritable chef-d’œuvre et non pas une succession de tentatives de triche motivée uniquement par les gains potentiels affichés dans les colonnes des outils SEO.

Allez-y ! Rédigez le guide de référence sur un sujet utile et vous n’aurez pas besoin de faire du netlinking au bazooka pour attirer du trafic.
– Nicolas Laruelle

Cet article s’achève et la toute dernière question qui se pose est la suivante : 

Est-ce qu’à la fin de votre lecture, cet article sera déjà indexé sur Google ?

Ne pas se faire indexer un article sur l’indexation Google, ça serait le comble du référenceur.

On vous laisse vérifier par vous-même 😉