Depuis l’arrivée de GPT-3, les générateurs de contenu ont multiplié les cas d’utilisation du SEO. Il semble qu’une mise à jour bimensuelle pour passer en revue les nouveaux progrès dans le domaine des modèles de langage s’impose.

Tout d’abord, fin 2021, le très grand club des modèles linguistiques s’est considérablement développé.

Chaque pays a essayé de présenter ses technologies et de les rendre accessibles à travers des documents de recherche et des démonstrations publiques ou privées.

Voici les principaux concurrents de la course :

  • États-Unis : OpenAI – Turing NLG.
  • Chine : Wu Dao 2.0 – PanGu-Alpha.
  • Corée du Sud : HyperCLOVA.
  • Israël : A121 (Jurassic-1).
  • Europe : Aleph Alpha.
  • Source ouverte : EleutherAI.

Chaque modèle a ses forces et ses faiblesses.

Pour les tester, de nombreux éditeurs de logiciels SEO ou agences SEO testent désormais ces modèles.

Comment choisir un modèle GPT-3 ?

Vous pouvez penser que plus le modèle aura de paramètres, mieux ce sera (NDLR : un paramètre correspond à un concept appris par l’IA).

Mais vous auriez tort.

Le critère numéro un n’est absolument pas le nombre de paramètres, car on peut obtenir de très bons résultats avec des modèles plus légers.

Ce sont plutôt les données sur lesquelles le modèle a été formé.

En effet, pour être efficace, un modèle doit être capable de comprendre un grand nombre de domaines disparates.

La première chose à faire est de savoir comment le modèle a été formé. Pour GPT-3, le schéma suivant aide :

Diagramme GPT-3.

Nous pouvons voir que GPT-3 a été principalement formé avec des données de :

  • Webarchive entre 2016 et 2019.
  • WebText, qui correspond aux récupérations de données sur le web.
  • Wikipédia.
  • Livres en anglais (Books1)
  • Livres dans d’autres langues (Books2).

Maintenant, si nous regardons comment les modèles open-source sont entraînés, nous voyons que les sources sont assez différentes.

Sources basées sur le projet The Pile.

Tout est basé sur le projet The Pile, qui est un ensemble de données de 825 Go de textes anglais diversifiés, gratuits et accessibles au public.

Avec The Pile, on trouve des données très variées telles que des livres, des dépôts GitHub, des pages web, des journaux de discussion, des articles en médecine, physique, mathématiques, informatique et philosophie.

De manière générale, il sera important de tester le modèle linguistique dans votre langue et surtout sur le vocabulaire spécifique de votre site web.

Avant d’examiner des cas d’utilisation spécifiques au référencement, examinons les pièges.

Les pièges de la génération de contenu GPT-3 pour le référencement

Pour générer des textes qualitatifs qui intéressent vos utilisateurs, il est important de connaître les pièges à éviter.

Tout d’abord, quel que soit le modèle que vous choisissez, vous devez lui fournir en entrée des exemples de qualité afin qu’il puisse les imiter et surtout respecter un type de texte précis.

Si vous demandez à un modèle de langage de générer du contenu sur les « plombiers new-yorkais », le modèle empruntera des voies diverses et souvent inadaptées :

  • Doit-il créer un répertoire inventé ?
  • Doit-il créer du contenu sur un plombier new-yorkais ?
  • Faut-il créer un dialogue entre plombiers à Paris ?
  • Peut-être un poème sur la plomberie à New York ?

Bref, le modèle sera perdu.

Deuxièmement, les modèles de langage ne gèrent pas du tout le contenu dupliqué.

Par conséquent, quel que soit le texte que vous générez, vous devrez utiliser un outil tiers pour vérifier que le modèle n’a pas dupliqué quelque chose qu’il a appris – et plus particulièrement, que le texte n’existe pas déjà et qu’il est unique.

Il existe de nombreux outils disponibles pour confirmer si votre contenu est unique. Si ce n’est pas le cas, régénérez simplement le contenu.

De plus, les modèles de génération de contenu n’optimisent pas du tout le texte pour la recherche.

Encore une fois, ils sont formés sur une grande variété de sources donc vous devrez les guider avec tous les outils sémantiques qui existent sur le marché.

Vous pouvez également leur demander de mettre l’accent sur des mots-clés et d’expliquer vos concepts plus en détail.

Enfin, le modèle peut inventer des données. En effet, les modèles ont un paramètre de créativité.

Si le modèle est paramétré pour permettre une grande créativité, il peut parfois inventer des caractéristiques pour un objet par exemple, ce qui peut générer des incohérences dans vos textes.

Cas d’utilisation de la génération de contenu pour le référencement

Au cours des huit derniers mois, j’ai testé de nombreux cas d’utilisation de génération de contenu différents.

Avec des templates gratuits comme GPT-Neo et GPT-J, nous avons eu de très bons résultats sur les cas d’utilisation suivants :

  • Extraction de concepts (extraction de lieux, de personnes, etc.).
  • Extraction de questions d’un texte.
  • Réponses à des questions basées sur un texte.
  • Génération de textes courts en anglais uniquement afin de créer des titres ou des méta descriptions.

D’autre part, avec un modèle payant comme GPT-3 avec une tarification accessible, nous avons non seulement réussi à générer des textes longs et spécifiques mais aussi à créer des résumés textuels sophistiqués.

Résumés textuels sophistiqués dans OpenAI.

L’image n’est pas facile à lire mais montre les exemples de saisie qui sont donnés en gras, puis le texte généré par le modèle qui est en italique.

Ici, le but est de créer un texte incitatif pour donner envie aux gens d’acheter un produit.

GPT-3 comprend parfaitement le ton et la longueur requis du texte et inclut les mots à utiliser. Le texte est généré en moins de 10 secondes !

Voici le texte généré :

Abandonnez-vous à vos rêves d’enfant. Vous souvenez-vous encore de votre premier jeu vidéo ? Grâce aux progrès technologiques, vous pouvez les revivre à nouveau. Vous pouvez jouer avec un autre joueur sur la route via les consoles Nintendo DS, PlayStation ou Xbox !

Avec la Nintendo Switch, essayez des jeux amusants comme Mario Kart 8 Deluxe – affrontez vos rivaux et vivez des aventures magiques avec Mario, Zelda et d’autres personnages. Profitez d’une gamme incroyable de jeux AAA ; que vous préfériez les jeux de combat ou les jeux d’aventure ou les jeux multijoueurs, la PS4 propose des abonnements PS Plus adaptés à vos besoins !

Xbox propose également un accès illimité à des applications de divertissement comme Netflix et Youtube pour peu d’argent. Que vous choisissiez la PS4, la xbox ou la nouvelle Nintendo Switch, il vous sera facile de vous connecter en famille ou entre amis via des applications comme Skype pour passer de bons moments entre amis.

Assurez-vous de ne pas manquer cette opportunité!

Bien sûr, la relecture est toujours nécessaire pour améliorer le texte, mais cette technologie fait gagner beaucoup de temps et permet aux humains de se concentrer sur des problèmes à forte valeur ajoutée.

Passons à deux révolutions dans la génération de contenu.

Deux révolutions pour le SEO

Auparavant, GPT-3 n’était peut-être pas en mesure de générer un contenu spécifique car il n’était pas formé pour le faire, comme nous l’avons vu précédemment.

Maintenant, vous avez la possibilité de réentraîner le modèle.

Donnez-lui simplement entre 20 et 100 exemples avec vos instructions en entrée et la réalisation idéale que vous souhaitez qu’il produise en sortie :

{"prompt":"CTA:nnsubject: smartphonenn words: smartphone, Samsung, mobile phones, Xiaomi, Samsung, Apple, Huawei, Sony, iPhone, intelligent mobile phones, Androidnn ","completion":"Looking for a new smartphone? You've shortlisted a Samsung Galaxy or a Huawei model, but you haven't made a decision yet? Choose a smartphone in our product range and enjoy the best of the new mobile phones at an unbeatable price! You're guaranteed to find a smartphone at the best price, so don't miss out! It's never easy to find the best option among a multitude of smartphones: Xiaomi, Samsung, Apple, Huawei, Sony, or even Honor. Smartphones - intelligent mobile phones - aren't just synonymous with Apple's iPhone, but include many models. Smartphones using the Android operating system are the most common."}

L’opération prend du temps, mais vous disposez alors d’un modèle optimisé qui correspond à votre cas d’utilisation, en particulier si vous devez utiliser un vocabulaire spécifique pour un créneau, un secteur ou un thème particulier lors de l’optimisation de votre référencement.

Cela ne prend que deux lignes de code Python. La partie la plus fastidieuse est, bien sûr, la création de ce fichier d’exemple.

Fichier d'exemple sur OpenAI.

Enfin, passons au dernier sujet qui m’a particulièrement passionné ce mois-ci : la génération de code !

En fait, une nouvelle technologie a été publiée où nous donnons des instructions et le nouveau moteur OpenAI Codex est capable de générer du code Python pour résoudre nos problèmes.

Commençons par préciser qu’il s’agit de problèmes simples : cela ne peut pas remplacer les développeurs car il faudrait fournir à l’IA tout le code mis en place ainsi que toutes les contraintes techniques.

En revanche, d’un point de vue pédagogique et surtout dans une approche no-code, c’est super de pouvoir lui demander de se connecter à une source de données (Mysql, Excel, CSV, API, etc.) et de générer le bonnes vues en quelques secondes.

Récupération du fichier journal de la NASA pendant une journée.

Voici un mini-exemple où je récupère le fichier journal de la NASA pour la journée du 1er août 1995 et demande un graphique à barres avec le nombre total d’URL visitées dans l’heure.

Ensuite, avec un simple éditeur de texte, vous pouvez voir le résultat en copiant et collant le code.

Afin d’aller encore plus loin dans le concept de no-code, je prépare une application web où tout sera piloté par du texte.

La seule limite à l’utilisation des modèles de langage en SEO est votre imagination. Vous pouvez certainement créer un tableau de bord SEO complet de cette façon en décomposant chacune des vues souhaitées, étape par étape.

Les modèles linguistiques réservent encore beaucoup de surprises et de nombreux nouveaux usages sont à venir pour le marketing.

Davantage de ressources:

  • Comment la génération de langage naturel change le jeu SEO
  • Faire plus avec moins : génération automatisée de contenu de haute qualité
  • Marketing de contenu : le guide ultime du débutant

Image en vedette : Jus de vecteur/Shutterstock

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici