Deux requêtes apparaissent dans vos logs. GPTBot/1.0 charge une page produit. ChatGPT-User/1.0 charge la même page. GA4 ne voit aucune des deux, car elles n'exécutent pas JavaScript. GSC ne les voit pas non plus, car ses rapports IA concernent surtout les fonctionnalités Google. Les traiter comme simple bot traffic revient à perdre une information essentielle.
GPTBot peut venir pour l'entraînement du modèle : valeur long terme. ChatGPT-User peut venir parce qu'un vrai utilisateur demande à ChatGPT de consulter votre page : signal commercial immédiat et fort.
Training : GPTBot, ClaudeBot, Meta-ExternalAgent, GoogleOther, Bytespider, CCBot. Objectif : données d'entraînement. Valeur : connaissance de marque à long terme. Action : faits exacts, robots.txt, llms.txt.
Indexing : constitution d'index pour moteurs IA. L'enjeu est Schema, meta tags, Open Graph. Être indexé est nécessaire, mais ne veut pas dire être recommandé.
Search : OAI-SearchBot, PerplexityBot, Claude-SearchBot. Ils récupèrent des pages pour répondre à une requête utilisateur. Valeur : demande de marché. Action : Answer-First, FAQ, données produit à jour.
User Fetch : ChatGPT-User, Claude-User, Perplexity-User. L'IA récupère votre page pour un utilisateur précis dans une conversation. Valeur : élevée, proche d'une visite humaine de forte intention.
User Action : Google-Agent, Manus-User, NovaAct. Les agents exécutent des tâches pour l'utilisateur. Encore tôt, mais crucial pour l'Agentic Commerce.
GA4 ne voit pas les crawlers. GSC ne classe pas les crawlers tiers. Il faut des logs server-side, une bibliothèque d'User-Agent officiels et une analyse comportementale pour les cas non standard. CitationGraph sert à transformer des logs bruts en signaux business classés par intention.
Intent | À faire | À ne pas survaloriser |
|---|---|---|
Training | Faits de marque exacts, llms.txt | Vitesse de page uniquement pour training |
Indexing | Schema, meta, Open Graph | Données temps réel pour indexation pure |
Search | Answer-First, FAQ | Fréquence seule des crawlers |
User Fetch |
La différence opérationnelle est majeure. Si une équipe ne voit que le volume de bots, elle peut interpréter une hausse de GPTBot comme une hausse d'intention commerciale immédiate. Ce n'est pas nécessairement vrai. En revanche, si elle distingue User Fetch, elle sait quelles pages sont activement consultées dans des conversations IA. Les pages pricing, comparatifs, politiques de retour, FAQ et catégories deviennent alors des actifs directement exposés aux agents.
Un dashboard sérieux doit donc avoir trois niveaux : volume par plateforme, mix d'intention, et analyse par page. Le volume seul montre l'attention de l'écosystème. Le mix d'intention montre la qualité du signal. L'analyse par page transforme l'observation en action : quelle page corriger, quelle FAQ renforcer, quel contenu rendre plus factuel, quelle donnée structurer.
La qualité de classification doit aussi être visible. Les User-Agents officiels sont des signaux forts, mais toutes les plateformes ne documentent pas leurs crawlers avec le même niveau de transparence. Certaines requêtes exigent validation IP, examen des headers, fréquence, profondeur de crawl et contexte de page. Un bon système doit donc distinguer "confirmé", "probable" et "inconnu". Sans cela, on remplace l'aveuglement de GA4 par une fausse certitude dans les logs.
Organisationnellement, l'enjeu traverse plusieurs équipes. Le SEO structure les pages, l'ingénierie donne accès aux logs, la data définit le modèle d'intention, le juridique valide robots.txt et conditions d'accès, et Growth traduit user_fetch ou user_action en priorités commerciales. Crawler Intent n'est donc pas un rapport technique secondaire ; c'est une couche opérationnelle pour AI Search.
L'interprétation doit rester prudente. Une requête user_fetch isolée ne prouve pas une intention d'achat. Mais une hausse répétée sur les pages prix, comparatifs, politiques de retour et disponibilité produit indique que des utilisateurs assistés par IA avancent dans la phase d'évaluation. Il faut donc regarder des tendances hebdomadaires, des groupes de pages et des événements concurrents plutôt que des événements isolés. C'est la tendance qui rend le signal exploitable.
Le prochain article passe à l'architecture pratique de monitoring pour les marques DTC.
A : Par User-Agent matching, puis analyse de comportement.
A : Long terme : ce que les modèles apprennent sur votre marque.
A : Pas dans GA4, mais commercialement c'est proche d'une visite de forte intention.
A : Encore émergent, mais stratégique pour l'Agentic Commerce.
A : Oui, mais avec moins de transparence UA ; l'analyse comportementale est nécessaire.
Obtenez un audit gratuit de recherche IA pour comprendre la visibilité de votre marque dans les réponses IA.
Audit gratuit de recherche IAPrix, politiques, CTA à jour
Ignorer les pages user_fetch |
User Action | Données structurées, API, formulaires | Reporter Agentic Commerce |