Retour au blog
    ·GEO · Pratique · Guide

    Comment être cité par ChatGPT, Perplexity et Claude : guide pratique 2026

    Six leviers concrets pour augmenter la probabilité d'être cité comme source par les principaux moteurs de recherche IA. Un guide opérationnel destiné aux équipes marketing francophones.

    Cet article complète les deux précédents en passant des concepts aux actions opérationnelles. L'objectif est simple : à la fin de la lecture, une équipe marketing francophone doit savoir exactement quelles actions engager pour augmenter la probabilité que sa marque soit citée comme source dans les réponses générées par ChatGPT, Perplexity, Claude et Gemini.

    Comment chaque moteur sélectionne ses sources

    Avant les leviers, un point sur les mécaniques. Bien que les détails exacts soient propriétaires, on peut décrire les grandes lignes de chaque moteur à partir de la documentation publique et des comportements observés.

    Perplexity fonctionne en mode retrieval-augmented : à chaque requête, le moteur effectue une recherche web en temps réel via son crawler et son partenariat avec des index tiers, sélectionne les pages les plus pertinentes, puis les transmet à un LLM (Sonar, son modèle maison) qui synthétise. Les sources citées sont celles que le moteur de recherche a sélectionnées avant la génération.

    ChatGPT combine deux régimes : un régime « connaissances entraînées » (le modèle répond à partir de ce qu'il a appris pendant son entraînement, qui inclut un corpus web crawlé jusqu'à une date donnée) et un régime « web search » (activé pour les requêtes nécessitant des informations à jour, où le modèle effectue une recherche live). La probabilité d'être cité dépend donc à la fois de la présence dans le corpus d'entraînement et de la qualité du référencement web classique.

    Claude suit une logique proche de ChatGPT, avec un poids plus important accordé à la qualité éditoriale et aux structures question-réponse. Anthropic est connu pour valoriser les contenus factuels et bien structurés.

    Gemini est intégré à Google et bénéficie de l'index Google complet. Pour Gemini, la performance SEO classique reste un signal majeur, ce qui en fait paradoxalement le moteur où le SEO traditionnel produit encore le meilleur retour GEO.

    Levier 1 — Autoriser et faciliter le crawl IA

    C'est la fondation. Un site mal configuré peut bloquer involontairement les crawlers IA et ne sera tout simplement pas lu par les LLMs.

    Trois fichiers à publier à la racine du domaine.

    Le robots.txt doit autoriser explicitement les principaux crawlers IA : GPTBot, ClaudeBot, anthropic-ai, PerplexityBot, Google-Extended, CCBot. Beaucoup de sites les bloquent par défaut depuis 2023 sur des bases défensives — ce qui revient à se rendre invisible aux LLMs. Le bon réglage par défaut, pour une entreprise qui veut être citée, est l'autorisation explicite de chacun de ces agents.

    Le fichier llms.txt est devenu une convention reconnue par Anthropic et utilisée par de plus en plus de crawlers. C'est l'équivalent du robots.txt, mais destiné aux LLMs : il décrit en langage naturel ce que fait l'entreprise, pour qui, sur quels marchés. Voir un exemple sur www.dopageo.ai/llms.txt.

    Le sitemap.xml reste indispensable. Les crawlers IA s'en servent pour découvrir l'arborescence du site.

    Levier 2 — Structurer les pages avec Schema.org

    Les balises JSON-LD constituent un canal de communication direct avec les LLMs. Trois schémas méritent une attention particulière.

    Organization ou LocalBusiness selon la nature de l'entité. Cette balise donne au LLM une fiche d'identité de l'entreprise : nom, description, URL, adresse postale, langue de travail, zone géographique servie. C'est cette fiche qui sera utilisée pour répondre à des questions du type « qui est l'entreprise X ? ».

    FAQPage sur les pages de support et les pages produit. Les questions et réponses contenues dans ce schéma sont fréquemment reprises verbatim par les LLMs lorsqu'un utilisateur pose une question voisine. C'est l'un des leviers les plus directs pour influencer la formulation finale d'une réponse de ChatGPT ou Claude.

    SoftwareApplication, Product ou Service selon le métier, pour décrire de manière structurée l'offre commerciale (prix, devise, catégorie, fournisseur, langues disponibles).

    Le test de validation se fait sur l'inspecteur officiel de Google, Rich Results Test, qui détecte la majorité des erreurs de syntaxe.

    Levier 3 — Adopter un format question-réponse

    Les LLMs sont entraînés sur d'immenses corpus de questions et réponses. Lorsqu'ils synthétisent une réponse, ils privilégient les sources qui adoptent ce même format : une question explicite suivie d'une réponse claire et complète.

    Concrètement, sur les pages clés du site, il faut intégrer des sections qui anticipent les questions que les prospects posent à un assistant IA. Trois bonnes pratiques.

    Anticiper les questions réelles. Plutôt que d'inventer des questions marketing, partir des questions effectivement posées par les prospects en avant-vente, en support, lors des entretiens utilisateurs. Ces questions ont une probabilité élevée d'être posées aussi à un LLM.

    Formuler la réponse en première phrase. Le LLM extrait souvent les premières phrases d'une section comme candidate à la citation. Une question doit être suivie immédiatement d'une réponse synthétique de deux à quatre phrases, avant tout développement.

    Sourcer les chiffres. Une statistique sourcée a beaucoup plus de chances d'être reprise qu'un chiffre lancé sans référence. Citer la source, même approximativement, augmente la confiance que le LLM accorde à la page.

    Levier 4 — Construire l'autorité externe

    Aucun signal interne ne remplace la présence sur des sources tierces que les LLMs respectent. Cinq canaux comptent.

    Wikipédia, lorsque l'entreprise a une notoriété suffisante pour justifier une page (et seulement dans ce cas — l'auto-création de page est non seulement contre-productive mais sanctionnée). Wikipédia est l'un des corpus les plus surpondérés dans l'entraînement des LLMs. Une page Wikipédia bien sourcée constitue une autorité durable.

    Presse spécialisée et médias sectoriels. Les LLMs valorisent les mentions par des sources éditoriales reconnues. Pour une entreprise francophone, les médias professionnels du secteur (Les Échos, La Tribune, L'Usine Nouvelle, Frenchweb, Maddyness côté France ; Trends Tendances en Belgique ; PME Magazine en Suisse romande ; Les Affaires au Québec) sont des cibles de relations presse à haute valeur.

    LinkedIn. Les publications LinkedIn de qualité sont indexées par plusieurs LLMs et contribuent à la densité de mentions. Une stratégie de publications régulières et substantielles, par les dirigeants ou par les experts internes, alimente cette densité.

    Annuaires sectoriels et bases de données B2B. Pour beaucoup de secteurs, des annuaires spécialisés sont utilisés comme corpus de référence par les LLMs lorsqu'ils répondent à des questions du type « quelles sont les entreprises X dans le secteur Y ? ».

    Podcasts et conférences. Les retranscriptions de podcasts et de conférences sont de plus en plus présentes dans les corpus d'entraînement. Une intervention de fond, retranscrite et publiée, crée un signal d'autorité durable.

    Levier 5 — Maintenir une cohérence sémantique sur l'ensemble du site

    Les LLMs évaluent la cohérence d'un site comme un signal de fiabilité. Un site qui parle de tout et de rien sera moins identifié comme source légitime sur un domaine d'expertise qu'un site spécialisé, même de taille plus modeste.

    Concrètement, cela signifie qu'il vaut mieux concentrer le contenu éditorial sur trois ou quatre thèmes piliers que de couvrir vingt sujets superficiellement. Cela vaut pour les pages produits, pour le blog, pour les études de cas. Cette concentration sémantique facilite la classification de l'entreprise par les LLMs et augmente la probabilité d'être cité sur les requêtes du domaine ciblé.

    Levier 6 — Mesurer et itérer

    Sans mesure, il est impossible d'évaluer l'efficacité des optimisations. La mesure GEO suit un protocole simple.

    Définir un panel de cinq à quinze questions représentatives des intentions de recherche commerciales du secteur. Ces questions doivent être formulées comme un prospect réel les poserait à un assistant IA, en français pour un marché francophone.

    Interroger systématiquement les principaux LLMs avec ce panel. Mesurer pour chaque réponse si l'entreprise est citée comme source, mentionnée dans le texte, ou absente. Calculer un score de visibilité par moteur, puis un score consolidé.

    Refaire la mesure à intervalle régulier — typiquement mensuel — pour observer l'effet des optimisations et détecter les régressions.

    C'est précisément ce que fait le diagnostic dopageo.ai, qui produit un score multi-LLM consolidé et identifie les leviers à activer en priorité selon les résultats.

    Erreurs fréquentes

    Quelques pièges que l'on observe régulièrement sur les sites francophones.

    Bloquer les crawlers IA par excès de prudence. Beaucoup d'équipes techniques ont ajouté User-agent: GPTBot Disallow: / en 2023 sur des bases défensives. Cette configuration, conservée sans réflexion, rend l'entreprise invisible des LLMs. À déverrouiller en priorité.

    Sur-optimiser pour les mots-clés. Bourrer une page de mots-clés identifiés via Ahrefs ne fonctionne pas en GEO. Pire, cela donne au LLM le signal d'une page peu naturelle qu'il aura tendance à éviter.

    Multiplier les pages thinnes. Plutôt que cinquante pages courtes sur des variantes de mots-clés, mieux vaut dix pages denses et structurées sur les questions essentielles du métier.

    Auto-promotion explicite dans les FAQ. Une question du type « quelle est la meilleure entreprise dans le secteur X ? » suivie d'une réponse qui se cite elle-même est détectée comme un schéma d'auto-promotion par les LLMs et nuit au scoring global du site.

    Négliger la mise à jour. Les LLMs valorisent la fraîcheur des contenus, surtout en mode web search. Une page non mise à jour depuis trois ans verra son poids diminuer mécaniquement.

    Ce qu'il faut retenir

    L'optimisation GEO repose sur six leviers complémentaires : autoriser le crawl IA, structurer avec Schema.org, adopter un format question-réponse, construire l'autorité externe, maintenir une cohérence sémantique, mesurer et itérer. Aucun de ces leviers n'est en soi décisif, mais leur combinaison produit un effet cumulatif significatif sur la fréquence de citation par les LLMs.

    L'investissement initial est modéré — un audit, quelques semaines de travail technique et éditorial, la mise en place d'un suivi mensuel. Le retour, en revanche, est durable : chaque citation gagnée dans une réponse de ChatGPT ou Perplexity est un point de contact prospect que les concurrents ne récupéreront pas avant d'avoir engagé le même travail.

    Pour démarrer, le plus simple est d'effectuer un diagnostic initial afin d'établir une référence chiffrée. C'est la fonction du diagnostic dopageo.ai.