Vous avez peut-être entendu parler de regex mais vous ne savez pas trop comment elle peut être utilisée dans le référencement ou si elle s’intègre dans votre propre stratégie.

Les expressions régulières, ou ‘regex’, sont comme un langage de programmation en ligne pour les recherches de texte qui vous permettent d’inclure des chaînes de recherche complexes, des correspondances partielles et des caractères génériques, des recherches insensibles à la casse et d’autres instructions avancées.

Vous pouvez les considérer comme la recherche d’un modèle plutôt que d’une chaîne de texte spécifique.

Par conséquent, ils peuvent vous aider à trouver des ensembles complets de résultats de recherche qui, à première vue, peuvent sembler avoir peu en commun les uns avec les autres.

Les expressions Regex sont un langage à part entière et la première fois que vous en voyez un, il peut sembler assez étranger.

Mais ils sont assez faciles à apprendre et peuvent être utilisés avec JavaScript, Python et d’autres langages de programmation, ce qui en fait un outil de référencement polyvalent et puissant.

Dans ce guide, vous apprendrez les opérateurs regex courants, comment utiliser des filtres regex plus avancés pour le référencement, comment utiliser regex dans Google Analytics et Google Search Console, et plus encore.

Vous trouverez également des exemples de regex au travail de différentes manières dans le référencement.

À quoi ressemble Regex ?

Une expression régulière comprend généralement une combinaison de texte qui correspondra exactement dans les résultats de la recherche, ainsi que plusieurs opérateurs qui agissent davantage comme des caractères génériques pour obtenir une correspondance de modèle plutôt qu’une correspondance de texte exacte.

Cela peut inclure un caractère générique à caractère unique, une correspondance pour un ou plusieurs caractères, ou une correspondance pour zéro ou plusieurs caractères, ainsi que des caractères facultatifs, des sous-expressions imbriquées entre parenthèses et des fonctions « ou ».

En combinant ces différentes opérations ensemble, vous pouvez construire une expression complexe qui peut atteindre des résultats très étendus, mais très spécifiques.

Opérateurs Regex communs

Voici quelques exemples d’opérateurs regex courants :

. Une correspondance générique pour n’importe quel caractère unique.

.* Une correspondance pour zéro ou plusieurs caractères.

.+ Une correspondance pour un ou plusieurs caractères.

d Une correspondance pour tout chiffre numérique unique compris entre 0 et 9.

? Inséré après un caractère pour en faire une partie facultative de l’expression.

| Une ligne verticale ou un caractère « tuyau » indique une fonction « ou ».

^ Utilisé pour indiquer le début d’une chaîne.

$ Utilisé pour indiquer la fin d’une chaîne.

( ) Utilisé pour imbriquer une sous-expression.

Inséré avant un opérateur ou un caractère spécial pour « l’échapper ».

Certains langages de programmation, tels que JavaScript, autorisent l’inclusion de « drapeaux » après le modèle de regex lui-même, et ceux-ci peuvent encore affecter le résultat :

g Renvoie toutes les correspondances au lieu de la première uniquement.

i Renvoie des résultats insensibles à la casse.

m Active le mode multiligne.

s Active le mode ‘dotall’.

u Active la prise en charge complète d’Unicode.

y Recherche la position de texte spécifique (mode ‘collant’).

Comme vous pouvez le voir, ensemble, ces opérateurs et indicateurs commencent à se constituer en un langage logique complexe, vous donnant la possibilité d’obtenir des résultats très spécifiques sur de grands ensembles de données non ordonnés.

Comment utilisez-vous Regex pour le référencement ?

Regex peut être utilisé pour explorer les requêtes utilisées par différents segments d’utilisateurs, quelles requêtes sont communes à des zones de contenu spécifiques, quelles requêtes génèrent du trafic vers des parties spécifiques de votre site, etc.

Dans cet article, Hamlet Batista a montré comment utiliser regex en Python pour analyser les fichiers journaux du serveur, par exemple.

Et dans celui-ci, Chris Long vous a montré comment utiliser regex pour extraire la position, l’élément et le nom des fils d’Ariane associés à chaque URL de votre site dans le cadre d’un processus évolutif de recherche et de segmentation de mots clés.

Google encourage les professionnels du référencement à partager des exemples de la façon dont ils utilisent regex sur Twitter en utilisant le hashtag #performanceregex.

Voici quelques conseils de SEO Twitter (vous remarquerez que c’est un hashtag assez silencieux – ajoutez vos propres exemples si vous en avez !) :

Utiliser Regex sur Google Analytics

L’une des utilisations les plus courantes de regex pour le référencement est dans Google Analytics, où les expressions régulières peuvent être utilisées pour configurer des filtres afin que vous ne voyiez que les données que vous souhaitez voir.

En ce sens, l’expression est utilisée pour exclure des résultats, plutôt que pour générer un ensemble de résultats de recherche inclusifs.

Par exemple, si vous souhaitez exclure des données des adresses IP sur votre réseau local, vous pouvez filtrer 192.168.*.* pour supprimer la plage complète de 192.168.0.0 à 192.168.255.255.

Filtres SEO Regex plus avancés

Comme exemple plus complexe, imaginons que vous ayez deux marques : regex247 et regex365.

Vous pouvez filtrer les résultats qui correspondent à n’importe quelle combinaison d’URL contenant ces noms de marque, comme regex247.biz ou www.regex365.org.

Une façon de le faire est d’utiliser une expression « ou » assez simple :

.*regex247.*|.*regex365.*

Cela supprimerait toutes les URL correspondantes de vos données Analytics, y compris les chemins de sous-dossiers et les URL de pages spécifiques qui apparaissent sur ces noms de domaine.

Un mot d’avertissement

Il convient de noter que, comme pour votre fichier robots.txt, une expression regex mal écrite peut assez facilement filtrer la plupart ou la totalité de vos données en incluant une correspondance générique illimitée.

La bonne nouvelle est que dans de nombreux cas de référencement, le filtre n’est appliqué à vos données qu’au stade du rapport, et en modifiant ou en supprimant votre expression regex, vous pouvez restaurer une visibilité complète sur vos données.

Vous pouvez également tester les expressions régulières sur un certain nombre d’outils de test en ligne, afin de voir si elles atteignent le résultat escompté, ce qui vous permet de « sandboxer » vos expressions regex avant de les lâcher sur l’ensemble de votre ensemble de données.

Pour créer des filtres regex sur Google Analytics, accédez d’abord au type de rapport que vous souhaitez créer (par exemple Comportement > Contenu du site > Toutes les pages ou Acquisition > Tout le trafic > La source/Moyen).

Sous le graphique, en haut du tableau de données, recherchez le champ de recherche et cliquez sur Avancée pour afficher les options de filtrage avancées.

Ici, vous pouvez inclure ou exclure des données en fonction d’une dimension ou d’une métrique particulière. Dans la liste déroulante après avoir sélectionné votre dimension, choisissez Correspondance RegExp puis entrez votre expression dans la zone de texte.

‘Ou’ Et ‘Et’ Dans Google Analytics Regex

Pour créer une expression « ou » dans Google Analytics, incluez simplement le caractère pipe (le | symbole de trait vertical) entre les segments appropriés de votre expression.

Les expressions régulières de Google Analytics ne prennent pas en charge les instructions « et » dans une même expression régulière ; cependant, vous pouvez simplement ajouter un autre filtre pour y parvenir.

Sous votre première expression régulière, cliquez simplement sur Ajouter une dimension ou une statistique et entrez votre prochaine regex. De cette façon, vous pouvez empiler autant d’expressions que vous le souhaitez et elles seront traitées comme une seule instruction « et » logique lors du filtrage de vos données.

Utilisation de Regex dans la console de recherche Google

En 2021, Google Search Console a commencé à prendre en charge la syntaxe Re2 de regex, permettant aux webmasters d’inclure et d’exclure des données dans l’interface utilisateur.

Vous trouverez tous les métacaractères pris en charge par Google Search Console dans cette référence de syntaxe RE2 regex sur GitHub.

Au moment de la rédaction, il y a une limite de caractères de 4096 caractères (ce qui est généralement suffisant…).

Les exemples que vous pouvez utiliser dans la Search Console peuvent être le filtrage des requêtes contenant une marque spécifique et les variantes que les utilisateurs peuvent saisir, comme Facebook :

.*facebook.*|face*book.*|fb.*|fbook.*|f*book.*

Filtrez les utilisateurs qui trouvent votre site Web à l’aide de termes d’intention « commercial » :

.*(meilleur|top|alternatif|alternatif|vs|contre|examen*).*

Lié: Google Search Console ajoute de nouvelles options de filtre Regex

Pourquoi Regex est-il important pour le référencement ?

Enfin, pourquoi tout cela est-il important ?

Eh bien, il s’agit de prendre le contrôle de vos données et de filtrer les parties qui ne vous aident pas à améliorer votre référencement – qu’il s’agisse de pages ou de parties particulières de votre site Web, du trafic provenant d’une source ou d’un support spécifique, ou de votre propre site local. données du réseau.

Vous pouvez créer des expressions régulières assez simples pour obtenir un filtre « inclure » ​​ou « exclure » ​​de base, ou écrire des expressions plus longues qui fonctionnent de manière similaire au code de programmation pour obtenir des résultats complexes et très spécifiques.

Et avec la bonne expression régulière pour chaque campagne, vous pouvez vérifier que vos efforts de référencement atteignent vos objectifs, vos ambitions et vos résultats – un moyen puissant de prouver un retour sur investissement positif sur vos futurs investissements en référencement.

Davantage de ressources:

  • Google Search Console ajoute de nouvelles options de filtre Regex
  • L’API Google Search Analytics peut enfin extraire les données de découverte
  • Référencement technique avancé : un guide complet

Image en vedette : Optura Design/Shutterstock

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici