Glossaire SEO / GEO

Termes fondamentaux

GEO (Generative Engine Optimization)

Ensemble des stratégies visant à optimiser la visibilité d'un contenu dans les réponses générées par les moteurs de recherche IA. L'équivalent du SEO pour les moteurs génératifs.

SEO (Search Engine Optimization)

Optimisation pour les moteurs de recherche classiques (Google, Bing) qui affichent des listes de liens. Le SEO reste le socle technique du GEO.

RAG (Retrieval-Augmented Generation)

Architecture technique utilisée par tous les moteurs génératifs. Le LLM ne répond pas de mémoire — il va d'abord chercher des documents pertinents sur le web (retrieval), puis génère sa réponse en s'appuyant sur ces documents (generation).

LLM (Large Language Model)

Modèle de langage de grande taille (GPT-4, Gemini, Claude, etc.) capable de comprendre et de générer du texte. Le moteur derrière les réponses génératives.

Moteur génératif (Generative Engine)

Moteur de recherche qui utilise un LLM pour synthétiser des réponses à partir de sources web, plutôt que d'afficher une liste de liens. Exemples : ChatGPT Search, Google AI Overviews, Perplexity, Copilot.

Métriques et mesure

AI Share of Voice (SoV) / Share of Model (SoM)

Part de voix dans les réponses IA. Pourcentage des citations de votre marque par rapport au total des citations dans votre catégorie.

Brand Mention Rate

Fréquence à laquelle votre marque est nommée dans les réponses IA pour un ensemble de requêtes ciblées.

Citation Frequency

Nombre de fois que votre contenu (URL, domaine) est cité comme source dans les réponses IA.

Recherche où l'utilisateur obtient sa réponse directement dans la page de résultats (ou dans la réponse IA) sans cliquer sur aucun lien. En hausse avec les moteurs génératifs (69% en 2025).

Visibility Score

Métrique définie dans le papier Princeton GEO, basée sur le nombre de mots cités pondéré par la position dans la réponse (les citations en début de réponse ont plus de poids).

Concepts techniques

E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness)

Cadre d'évaluation de Google pour la qualité du contenu. Expérience directe, expertise démontrée, autorité reconnue, fiabilité. Utilisé comme filtre binaire par Google AI Overviews (96% des citations passent ce filtre).

Knowledge Graph

Base de données de Google qui relie les entités (personnes, entreprises, lieux, concepts) entre elles. Les pages avec 15+ entités Knowledge Graph ont 4,8x plus de chances d'être citées par Google AI Overviews.

Schema markup / Données structurées

Balisage JSON-LD ajouté au code HTML pour aider les moteurs (classiques et IA) à comprendre le contenu. Schemas clés : Article, FAQPage, HowTo, Organization, LocalBusiness, Person.

Passage-level extraction

Les moteurs génératifs n'évaluent pas les pages entières — ils extraient des passages spécifiques (blocs de 134-167 mots). Chaque section doit être autocontenue et répondre à une question sans contexte additionnel.

Similarité cosinus

Mesure mathématique de la proximité sémantique entre deux textes (la requête et un passage). Google AI Overviews utilise un seuil de >0,88 pour l'alignement thématique.

Embeddings

Représentation vectorielle du texte dans un espace mathématique multidimensionnel. Permet aux moteurs IA de comparer la signification de textes plutôt que juste les mots.

llms.txt

Fichier Markdown à la racine d'un site, proposé par Jeremy Howard (2024). Fournit aux LLM une carte de lecture des contenus importants du site. Complémentaire à robots.txt et sitemap.xml.

Crawlers et bots

GPTBot

Crawler d'OpenAI utilisé pour l'entraînement des modèles et ChatGPT Search.

OAI-SearchBot

Crawler d'OpenAI spécifiquement pour la recherche web en temps réel de ChatGPT.

PerplexityBot

Crawler de Perplexity pour l'indexation et la recherche.

ClaudeBot

Crawler d'Anthropic pour l'entraînement de Claude.

Plateformes

Google AI Overviews (anciennement SGE)

Réponses synthétisées par Gemini affichées en haut des résultats Google. 2 milliards d'utilisateurs mensuels. Pipeline en 5 étapes filtrant 200-500 candidats vers 5-15 sources citées.

Fonctionnalité de recherche web intégrée à ChatGPT. Utilise l'index Bing + crawler OAI-SearchBot. 800 millions d'utilisateurs hebdomadaires.

Perplexity

Moteur de recherche conversationnel dédié, utilisant une architecture RAG avec son propre index. Le plus généreux en citations (5-15 par réponse).

Gemini (Google)

Famille de modèles IA de Google. Alimente les AI Overviews et Google AI Mode (mode conversationnel). 8,65% du trafic referral IA en mars 2026, en dépassant Perplexity. Utilise l'index Google Search.

Google AI Mode

Mode conversationnel de recherche Google, distinct des AI Overviews. Réponses plus longues, plus de sources citées. Google cite ses propres propriétés dans 17% des réponses AI Mode.

Copilot (Microsoft)

Assistant IA intégré à Bing et Microsoft 365. Utilise un modèle GPT couplé à l'index Bing via la technologie Prometheus.

Stratégies (papier Princeton)

Quotation Addition

Ajouter des citations directes d'experts et de sources crédibles dans le contenu. La stratégie GEO la plus efficace (+42,6%).

Statistics Addition

Inclure des statistiques et données quantitatives. Deuxième stratégie la plus efficace (+32,8%).

Fluency Optimization

Améliorer la clarté et la fluidité du texte. Troisième stratégie (+28,7%).

Cite Sources

Référencer des sources crédibles dans le contenu (sans citation directe). Quatrième stratégie (+27,7%).

Keyword Stuffing

Répéter les mots-clés de la requête dans le contenu. Contre-productif en GEO (-8,7%).

Earned Media

Earned media / Contenu tiers

Couverture médiatique, mentions par des sites tiers, avis clients — par opposition au contenu propriétaire (votre propre blog). Le earned media génère +239% de visibilité IA en médiane (Stacker Research, mars 2026 — ⚠️ Stacker est une plateforme de syndication avec un intérêt commercial ; corroboré par Muck Rack qui mesure 85% de citations issues du earned media).

Digital PR

Relations presse numériques : obtenir des mentions, des articles, des citations sur des sites tiers pour renforcer l'autorité d'entité.

NAP (Name, Address, Phone)

Coordonnées d'une entreprise. La cohérence du NAP sur toutes les plateformes est essentielle pour que les LLM identifient correctement l'entité.

Termes techniques web

SERP (Search Engine Results Page)

Page de résultats d'un moteur de recherche. En SEO classique, l'objectif est d'apparaître en haut de la SERP. En GEO, l'objectif est d'être cité dans la réponse générée qui apparaît au-dessus ou à la place de la SERP.

CTR (Click-Through Rate)

Taux de clics. Pourcentage d'utilisateurs qui cliquent sur un résultat après l'avoir vu. Les AI Overviews réduisent le CTR organique de -46,7% en moyenne.

Core Web Vitals

Métriques de performance web définies par Google : LCP (Largest Contentful Paint, chargement < 2,5s), INP (Interaction to Next Paint, interactivité < 200ms), CLS (Cumulative Layout Shift, stabilité visuelle < 0,1). Prérequis technique pour un bon crawl.

TTFB (Time To First Byte)

Temps entre la requête HTTP et le premier octet de réponse du serveur. Un TTFB > 3s peut entraîner un abandon du crawl par les bots IA.

JSON-LD (JavaScript Object Notation for Linked Data)

Format recommandé pour implémenter les données structurées (schema markup) dans les pages web. Ajouté dans une balise <script> dans le HTML.

CDN (Content Delivery Network)

Réseau de serveurs distribués géographiquement pour accélérer la livraison du contenu. Certains CDN (Cloudflare, Akamai) bloquent les crawlers IA par défaut dans leurs règles de protection.

WAF (Web Application Firewall)

Pare-feu applicatif web. Peut bloquer involontairement les crawlers IA s'il identifie leur comportement comme suspect.

Google Business Profile (anciennement Google My Business)

Fiche d'entreprise gratuite sur Google. Source d'information n°1 des LLM pour les entreprises locales. Alimente le Knowledge Panel et les AI Overviews.

Knowledge Panel

Encadré d'informations structurées qui apparaît à droite des résultats Google pour les entités reconnues (entreprises, personnes, lieux). Alimenté par le Knowledge Graph, il sert de source de données pour les moteurs IA.

Domain Authority (DA)

Score (0-100) créé par Moz estimant la probabilité qu'un domaine se classe bien dans les résultats de recherche. En GEO, la corrélation DA/citation IA est en chute (r=0,18 selon le papier Princeton) — le contenu intrinsèque pèse plus que l'autorité du domaine.

Dernière mise à jour : 2026-04-09