Dans une mise à jour du document d’aide de Googlebot, Google a discrètement annoncé qu’il explorerait les 15 premiers Mo d’une page Web. Tout ce qui se trouve après cette limite ne sera pas inclus dans les calculs de classement.

Google précise dans le document d’aide :

« Toutes les ressources référencées dans le HTML telles que les images, les vidéos, le CSS et le JavaScript sont récupérées séparément. Après les 15 premiers Mo du fichier, Googlebot arrête l’exploration et ne considère que les 15 premiers Mo du fichier pour l’indexation. La limite de taille de fichier est appliquée sur les données non compressées.

Cela a laissé certains dans la communauté SEO se demandent si cela signifiait que Googlebot ignorerait complètement le texte qui tombait sous les images à la coupure dans les fichiers HTML.

« C’est spécifique au fichier HTML lui-même, comme il est écrit », a précisé John Mueller, Google Search Advocate, via Twitter. « Les ressources/contenus intégrés extraits avec des balises IMG ne font pas partie du fichier HTML. »

Ce que cela signifie pour le référencement

Pour s’assurer qu’il est pondéré par Googlebot, le contenu important doit désormais être inclus en haut des pages Web. Cela signifie que le code doit être structuré de manière à placer les informations pertinentes pour le référencement avec les 15 premiers Mo dans un fichier HTML ou texte pris en charge.

Cela signifie également que les images et les vidéos doivent être compressées et non encodées directement dans le code HTML, dans la mesure du possible.

Les meilleures pratiques SEO recommandent actuellement de maintenir les pages HTML à 100 Ko ou moins, de sorte que de nombreux sites ne seront pas affectés par ce changement. La taille de la page peut être vérifiée avec une variété d’outils, y compris Google Page Speed ​​Insights.

En théorie, il peut sembler inquiétant que vous puissiez potentiellement avoir du contenu sur une page qui n’est pas utilisé pour l’indexation. En pratique, cependant, 15 Mo représentent une quantité considérable de HTML.

Comme l’indique Google, les ressources telles que les images et les vidéos sont récupérées séparément. D’après le libellé de Google, il semble que ce seuil de 15 Mo ne s’applique qu’au HTML.

Il serait difficile de dépasser cette limite avec HTML à moins que vous ne publiiez le texte de livres entiers sur une seule page.

Si vous avez des pages qui dépassent 15 Mo de HTML, il est probable que vous ayez des problèmes sous-jacents qui doivent être corrigés de toute façon.


La source: Centre de recherche Google
Image en vedette : SNEHIT PHOTO/Shutterstock

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici